# Som forklart i NLTK-boka, kapittel 5, del 4: Automatic tagging
# (Kommenter ut l?kkene med utskrifter for ? faktisk se utskriftene du vil)

# Importerer korpusdata
from nltk.corpus import brown

# Henter ut setninger med kategori 'news'
# Andre mulige kategorier i Brown-korpuset: adventure, fiction
brown_tagged_sents = brown.tagged_sents(categories = 'news')
brown_untagged_sents = brown.sents(categories = 'news')

# Tar en titt p? hvordan de markerte setningene ser ut.
# Hvert ord er lagret som et tuppel med ord og tilh?rende POS-tag.
for sent in brown_tagged_sents:
    for word in sent:
        print(word)

# Tar en titt p? hvordan de umarkerte setningene ser ut.
# Her f?r vi de samme ordene som over, men uten tagger
for sent in brown_untagged_sents:
    for word in sent:
        print(word)


# Obs: n?r du skal bruke regex-taggeren i NLTK,
# m? du ogs? importere NLTK slik f?r du begynner:
import nltk
# (helst helt ?verst i koden din, og ikke til slutt som her...)