- Igor Kononenko (FER):
On Biases in Estimating the Multi-Valued Attributes
- In early works on decision tree induction it was soon realized that
various heuristics tend to overestimate the attributes with more values.
We analyse the biases of eleven measures for estimating the quality of
the multi-valued attributes. The values of several well known functions
tend to linearly increase with the number of values of an attribute:
information gain, J-measure, gini-index, and relevance. The values of
gain-ratio, distance measure, Relief, and the weight of evidence
decrease for informative attributes and increase for irrelevant
attributes. The bias of the statistic tests based on the chi-square
distribution is similar but these functions are not able to discriminate
among the attributes of different quality. We also introduce a new
function based on the MDL principle whose value slightly decreases with
the increasing number of attribute's values.
- Damjan Bojadziev (IJS):
Goedlov operator in meta-cirkularna interpretacija
-
Goedlov operator razsiri sistem formalne aritmetike F z dodajanjem
Goedlovega stavka tega sistema: stavka, ki o sebi trdi, da ni dokazljiv
v F (in zato tudi res ni). Meta-cirkularni interpreter opravlja podobno
funkcijo v sistemu logicnega programiranja: krpa deduktivne luknje
izhodiscnega sistema, npr. obicajnega Prolog interpreterja.
Refleksivnost meta-cirkularnega interpreterja (ki lahko izvaja se samega
sebe) pa navaja na hipotezo, da je lahko tudi Goedlov operator
refleksiven: da pri razsirjanju sistema gleda tudi nase in uposteva
svojo vlogo v tem razsirjanju. Refleksiven Goedlov operator bi omogocal
hitrejse gibanje po zaporedju razsiritev aritmeticnega sistema, po
katerem dirkata duh in stroj v obicajni verziji Goedlovskega argumenta o
kognitivni premoci duha nad strojem.
- Ivan Bratko (FER, IJS):
Pretirano prilagajanje in Occamova britev v strojnem ucenju
-
Znano je, da pri ucenju iz nezanesljivih, sumnih podatkov dobimo
razvejane hipoteze, ki se pretirano dobro prilegajo ucnim primerom. Take
hipoteze so pogosto manj zanesljive od enostavnejsih hipotez. Ucinkovita
metoda za obravnavanje sumnih podatkov je poenostavljanje naucenih
hipotez, npr. z rezanjem odlocitvenih dreves. To se tudi sklada s
principom Occamove britve, ki daje prednost krajsim hipotezam. Vendar
nekateri eksperimentalni rezultati vzbujajo dvome. V predavanju bo podan
pregled nekaterih novejsih in nasprotujocih si rezultatov o uspesnosti
rezanja odlocitvenih dreves, utemeljenosti Occamovega principa ter o
pretirano temeljitem preiskovanju prostora hipotez.
- Miha Kralj:
Pregled karakteristik OS/2
-
OS/2 je eden izmed 32-bitnih operacijskih sistemov za osebne racunalnike,
ki se ni UNIX, zato je s svojo enostavnostjo in obenem zmogljivo zasnovo
primeren za vse zahtevnejse uporabnike, ki jim DOS in Windows nista vec
dovolj, UNIX pa jim je ze prevec.
OS/2 je vecopravilen, vecniten odprt sistem, ki je zgrajen na IBM-ovi
objektni osnovi SOM (System Object Model). SOM, oziroma DSOM
(Distribuirani SOM) sta temelj vseh IBM-ovih operacijskih sistemov in
predstavljata prvi korak proti DCE (Distributed Computing Enviroment).
OS/2 s svojim konceptom predstavlja le eno izmed moznosti v trenutnem
izboru operacijskih sistemov, a ga zaradi njegove enostavne ucljivosti
in zmogljivosti ne smemo prezreti.
- Tomaz Erjavec (IJS):
Opis morfologije v sistemu ALE-RA: primer oblikoslovja slovenskega glagola
-
ALE (Attribute Logic Engine) je sistem za prepoznavanje naravnega
jezika, primeren predvsem za opis sintakse. Morfologija je zajeta
s pravili, ki iz osnovnih leksikalnih nizov generirajo vse oblike besed.
Razsiritev ALE-R povezuje morfologijo in sintakso tako, da strukturira
leksikalna pravila po paradigmah in pozicijskih razredih. Razsiritev
ALE-A pa dodaja fonologijo (premene, naglasne sheme), ki predstavlja
besedne oblike s koncnimi avtomati. Dodaten modul preko omejitev skrbi
za njihovo dobro oblikovanost.
ALE-RA integrira tri nivoje jezikovne analize (sintaksa, morfologija,
fonologija) in je tako primeren za celovito predstavitev znanja o
raznovrstnih jezikih. Nadaljnje razsiritve so mozne v smeri
dvo-smernosti operacij (analiza in sinteza), njihove paralelizacije ter
pokritja dodatnih jezikovnih fenomenov.
- Dragan Gamberger (Rudjer Boskovic Institute, Zagreb):
A Minimization Approach to Propositional Inductive Learning
-
An approach to the problem of propositional inductive learning of
if-then-else rules, different from the commonly used ones, will be
presented. Main differences are: literal selection process that searches
for the smallest set of literals so that the completely correct rule for
all learning examples can be constructed and the nonnormal form of the
generated rules built by the search for necessary and sufficient
conditions of example classes. It will be also presented how iterative
application of the literal selection process can solve the problem of
learning from noisy domains by appropriate exclusion of dubious learning
examples. The results of application of the system that includes
described algorithms on a few publicly available domains including
breast cancer domain of Wisconsin hospitals will be discussed.
-
Marijan Miletic
(IJS):
DSP - Digitalna obdelava nizkofrekvencnih signalov v realnemu casu
-
Uspesen razvoj kompaktnega diska, digitalnega traku, hitrih telefonskih
modemov, racunalniske grafike, televizije velike locljivosti,
medicinskih tomografov in podobnih je tesno povezan s tehnologijo
digitalnih signalnih procesorjev (DSP), ki omogocajo zahtevno
matematicno obdelavo razlicnih procesov v realnemu casu. Na predavanju
bo predstavljen pregled tehnik DSP s poudarkom na obdelavi govornih in
radijskih signalov.
-
Bogdan Filipic
(IJS in Fakulteta za strojnistvo):
Metode evolucijskega racunanja
-
Evolucijsko racunanje pri resevanju problemov z racunalnikom posnema
nacela evolucije bioloskih sistemov. Podrocje obsega vec verjetnostnih
preiskovalnih oz. optimizacijskih metod. Najbolj znana metoda
evolucijskega racunanja so genetski algoritmi, v to skupino pa sodijo se
evolucijske strategije, evolucijsko programiranje in genetsko
programiranje. V preglednem predavanju bodo podane osnove teh metod ter
podobnosti in razlike med njimi. Sledil bo prikaz videa Genetic
Programming, ki razlozi delovanje te metode in pokaze stevilne primere
uporabe.
-
Martin Zitz
(Universitaet fuer Bildungswissenschaften, Celovec):
PEAPS - Possibilistic Expert Assessment and Pooling
-
The main task of processing expert opinions presented here is to group
and pool expert opinions about a certain number of variables to get
better results. This is done by quantifying certain aspects of the
supplied data and an ordering of the groups. In a next step the opinions
of the group-members are pooled with some pooling functions, resulting
in a new "virtual expert" opinion about the variable. The main advantage
of this approach is that (1) the values of the variables are not given
as "one shots", and (2) a certain number of errors, e.g.
underestimation, can be reduced.
The author will present this method of Expert Assessment based on the
ideas by Mrs. Sandri, Brasil, and show a rough idea of his PROLOG
implementation.
-
Dunja Mladenic
(IJS):
Avtomatsko nastavljanje parametra "m" pri naknadnem rezanju dreves:
uporaba deterministicnih in stohasticnih optimizacijskih algoritmov
-
Dolocanje vrednosti parametrov algoritma za strojno ucenje definiramo
kot optimizacijski problem. Za ocenjevanje kvalitete dolocene nastavitve
parametrov uporabimo precno preverjanje klasifikacijske tocnosti
odlocitvenih dreves, zgrajenih s podanimi vrednostmi parametrov. Za
gradnjo odlocitvenih dreves uporabimo sistem Magnus Asistent.
Na seminarju bo predstavljeno avtomatsko dolocanje vrednosti parametra
"m", uporabljenega pri naknadnem rezanju odlocitvenih dreves. Na
problemu uporabimo deterministicne in stohasticne optimizacijske
algoritme ter primerjamo njihovo delovanje in rezultate.
-
Marko Robnik
(FER):
Izraba pomnilnika pri preiskovanju prostora s strategijo
"najprej najboljsi" v linearnem prostoru
-
Korf je leta 1993 predstavil preiskovalni algoritem RBBFS po nacelu
"najprej najboljsi", ki deluje v prostoru, ki je linearna funkcija
dolzine resitve; to je bila bistvena izboljsava v primerjavi z algoritmi
tipa A*, ki delujejo v eksponentnem prostoru.
RBFS porabi zelo malo pomnilnika, vsekakor dosti manj, kot ga je na
voljo v danasnjih racunalnikih, zato sem ga izboljsal tako, da lahko
uporablja ves pomnilnik, ki je na voljo. Predstavil bom tri strategije
izrabe pomnilnika in rezultate pri igri osmih ploscic in problemu
trgovskega potnika.
-
Aram Karalic
(IJS):
Regresija v logiki prvega reda
-
Predstavili bomo algoritem za ucenje prologovih programov, ki
uporabljajo realne spremenljivke. Algoritem uporablja predznanje v
obliki poljubnih prologovih procedur, z njim lahko modeliramo dinamicne
sisteme (se ucimo iz casovnih vrst) in poiscemo razlicne regresijske
modele za razlicne dele atributnega prostora. Predstavili bomo osnovne
ideje algoritma in njegove aplikacije na nekaterih realnih sistemih.
-
Andrej Blejec
(Institut za biologijo):
Racunalniske simulacije - pripomocek za razumevanje statistike
-
Za ponazoritev nekaterih statisticnih pojmov in metod si lahko pomagamo
z graficno podprtimi racunalniskimi simulacijami. Pri statisticnih
simulacijah pripravimo podatke z vnaprej znanimi statisticnimi
lastnostmi, te pa potem skusamo razkriti s statisticno analizo. Z
dinamicno in interaktivno grafiko lahko ponazorimo pomen statisticnih
pojmov in delovanje statisticnih metod. Pri razvoju simulacijskih
programov si lahko pomagamo s splosnimi programskimi jeziki (npr.
Pascal) ali pa posezemo po razvitejsih statisticnih okoljih (npr. S-Plus
ali XLispStat). Moznosti, ki jih ponujajo posamezna razvojna okolja, si
bomo ogledali na primerih, ki so zanimivi in uporabni pri pouku
statistike.
-
Slobodan Ribaric
(University of Zagreb, Faculty of electrical engineering and computing):
Model za predstavitev casovno odvisnega znanja in sklepanje
-
Na seminarju bo podan kratek pregled shem za predstavitev casovno
odvisnega znanja. Prikazana bo shema za predstavitev znanja, ki temelji
na prilagoditvi Petrijevih mrez. Shema se uporablja za predstavitev in
sklepanje v casovno bogatih domenah.
-
Matjaz Gams
(IJS):
Inteligentni agenti
-
V svetu se odpira novo podrocje inteligentnih sistemov, tj. inteligentni
agenti. Namesto ekspertnih sistemov, ki skusajo nadomestiti eksperte,
skusajo inteligentni agenti nadomestiti agente, npr. zavarovalniske
agente, potovalne agente, tajnice itd. Podobno, kot nevronske mreze, je
bil osnovni pristop znan ze pred desetimi leti, sedaj pa ponovno
ozivlja. Prejsnjega miselnega guruja Minskyja nadomescajo operativno
usmerjeni raziskovalci kot Pattie Maes in Oren Etzioni. Posebej si bomo
ogledali agente na Internetu, kajti v boju z informacijsko
preobremenitvijo so agenti pozeli vidne uspehe. Inteligentne tajnice na
razlicnih nivojih svetujejo ali izvrsujejo bolj ali manj zapletene
zahteve uporabnikov.
V Sloveniji smo zaorali ledino s sistemom IOI, ki je popravljal crkovne
napake v operacijskem sistemu VAX/VMS. Dasiravno so bila mnenja o
primernosti metodologije s strani zunanjih opazovalcev deljena, sva bila
avtorja (Hribovsek magisterij, Gams raziskovalni mentor) ugodno
presenecena nad mocjo novega pristopa. Kot pri vsaki novi metodologiji
pa je tudi tu potrebno, da se `vzivis' v novo miselnost.
-
Ales Dobnikar, Tomaz Sef
(IJS):
Sinteza slovenskega govora
-
Sinteza govora predstavlja umetno generiranje govora iz danega besedila.
Skupaj s komplementarnim podrocjem razpoznavanja govora postaja eden on
pomembnejsih alternativ tako komunikacije clovek-stroj, kot tudi
komunikacije clovek-clovek.
V zadnjem casu so se razvile razlicne ucinkovite tehnike za manipuliranje z
akusticnimi posnetimi deli govora. Kvaliteta sistemov za sintezo govora pa ni
pogojena samo z razvojem tehnologije, ampak predvsem s poznavanjem parametrov
posameznega jezika in govora, ki so praviloma precej specificni.
Na seminarju bo predstavljena problematika sinteze govora, razvoj sistema za
sintezo govora na Institutu J. Stefan in metoda za modeliranje in konkatenacijo
akusticnih delov govora.
-
Uros Lotric
(FER):
Uporaba ucenja z ojacanjem pri igri Krizci in krogci
-
Na preprosti igri Krizci in krogci (Tic-Tac-Toe) sem preizkusil
uspesnost metod ucenja z ojacanjem. Pri teh metodah program vnaprej
pozna pravila igre, med igranjem pa ga obvescamo le o izidu posamezne
partije. Dober algoritem se lahko nauci igrati tako dobro, da ne izgubi
nobene partije, ceprav med ucenjem nima nobenega znanja o taktikah in
strategijah. Zelo hitro se algoritem nauci igrati povprecno dobro, za
igro brez porazov pa potrebuje zelo veliko ucenja.
-
Andrej Blejec
(Institut za biologijo):
Intervalsko ocenjevanje statisticnih parametrov
-
Verjetnostne porazdelitve pojavov navadno skusamo opisati s pomocjo
njihovih parametrov, na primer povprecja, standardne deviacije in
podobno. Vrednost parametra lahko ocenimo tockovno, tako da za oceno
vzamemo ustrezno vzorcno vrednost. Vzorcne vrednosti se od vzorca do
vzorca spreminjajo, zato skusamo opisati njihovo porazdelitev. Ta opis,
opis vzorcne porazdelitve ocen, pa nam pomaga pri intervalski oceni
parametra. Ce poznamo vzorcno porazdelitev, lahko za parameter dolocimo
interval zaupanja, ki bolje doloca mozne vrednosti parametra. Pri
dolocanju intervalov zaupanja se srecamo z vrsto statisticnih pojmov,
kot so standardna napaka ocene, vzorcna porazdelitev, pristranost ocene
in ne nazadnje tudi sama stopnja zaupanja.
S pomocjo racunalniske simulacije in dinamicne grafike si bomo
ogledali ozadje, na katerem temelji dolocevanje intervalov zaupanja.
Poskusili bomo razjasniti nekaj kljucnih statisticnih pojmov,
ki so nujni za razumevanje in interpretacijo intervalov zaupanja.