Beskjeder
Sp?rretimen blir 4. June kl. 14:15, med b?de Aleksander og Pierre. Beklager endringene.
L?reboka:
* Kapitler 1-10
* Kapitler 12-15
* Kapitler 19 (fra 19.1 til 19.4), 20 (fra 20.1 til 20.3) og 21 (21.1 og 21.2)
(med andre ord: hele l?reboka med unntak av kapitler 11, 16, 17, og 18)
Utvalgte utdelte artikler
* MapReduce: Simplified Data Processing on Large Clusters
* Suf?x arrays: A new method for on-line string searches
* Tries for Approximate String Matching
* Efficient String Matching: An Aid to Bibliographic Search
* How to squeeze a lexicon (sans implementation details)
* Tightly Packed Tries: How to Fit Large Models into Memory, and Make them Load Fast, Too
Alle slides brukt i undervisningen
* Tilgjengelig fra hhv l?rebokas hjemmeside og kursets hjemmeside
Alle ?vingsoppgaver
* Tilgjengelig fra kursets hjemmeside
Timeplanen for resten av semesteret er oppdatert. Legg merke til at forelesningen onsdag 7/5 er avlyst.
Kommentarer til oppgavene i assignment D finner dere her.
Programmeringsoppgaven i assignment C s? ut til ? ha falt vanskelig for mange. Tanken var at man skulle implementere en document-at-a-time l?sning der man traverserer mange postinglister samtidig, og underveis sjekker N/M kravet og bruker et Sieve objekt for ? holde rede p? kun de dokumentene som rankeren gir h?yest score. Se for?vrig ogs? kommentarene i koden utgitt som en del av assignment D, eller slides 11-14 her. :-)
For penn-og-papir oppgavene finner dere noen kommentarer her.
Slide settene fra Stanford som f?lger l?reboka er ved en inkurie ikke lenger tilgjengelig fra l?rebokas hjemmeside. Slidene kan derfor lastes ned herfra.
I perioden fra og med 4.3 til og med 8.4 blir det gjort noen mindre justeringer i gjennomf?ringen av gruppetimene:
- Hverken jeg eller Pierre vil v?re tilstede p? tirsdagene. Terminalstuene er fremdeles reservert til bruk for kurset, s? klart.
- Istedet vil jeg v?re igjen 1 time etter forelesningene p? onsdagene (det vil si fra 16-17) for ? svare p? sp?rsm?l i forbindelse med ?vingene.
Noen tilleggsslides om komprimering til morgendagens forelesning er lagt ut her.
Som bakgrunnsmateriale til neste forelesning er det lagt ut en del artikler her. Alle artiklene er ikke pensum, noen av dem er ekstramateriale for spesielt interesserte. Dersom du bare vil skumme gjennom noen f? av dem vil jeg anbefale:
- Artikkelen om suffix arrays. Denne er direkte relevant til en kommende programmeringsoppgave p? en ?ving.
- Artikkelen om tries for approximate string matching. Beskriver hvordan man passe effektivt kan finne alle innslag i en ordbok innen en gitt edit distance fra en referansestreng.
- Artikkelen om Aho-Corasick algoritmen. Relevant til en av tegn-og-fortell oppgavene p? en ?ving.
- Artikkelen om MapReduce. Ekstra bakgrunn for avsnitt 4.4 i l?reboka om distribuert indeksering.
Som varslet i dagens forelesning, p? grunn av reisevirksomhet blir det en mindre rokering p? forelesningsplanen: Forelesningen 19. februar blir avholdt og likevel ikke avlyst. Istedet blir forelesningen 26. februar avlyst. Forelesningsplanen skal n? v?re oppdatert.
Slider og annet undervisningsmateriale som blir brukt i forelesningene blir lagt fortl?pende ut i denne mappen. Unntaket er slides som tilh?rer l?reboka, som kan lastes ned fra l?rebokas hjemmeside.
There will only be one "gruppetime" per week this semester, on Tuesdays 10:15-12:00. The schedule currently shown on the webpage (which indicates two gruppetimer per week) will be updated soon.
The course will start on Wednesday, 15th of January at 14:15 with a short overview of the practical organisation of the course this semester.