Skip to content

Commit

Permalink
evaluation
Browse files Browse the repository at this point in the history
  • Loading branch information
Hämäläinen, Mika K committed Dec 15, 2017
1 parent ed64a64 commit 599ed85
Show file tree
Hide file tree
Showing 6 changed files with 279 additions and 0 deletions.
100 changes: 100 additions & 0 deletions test/100verbs.txt
Original file line number Diff line number Diff line change
@@ -0,0 +1,100 @@
suorittaa
ilmaista
kummuta
tasata
tehdä
pohtia
säännöstellä
hakea
siirtää
sonnustautua
järistä
uskoa
henkilöidä
ruuhkauttaa
myrskytä
hämmästyttää
subventoida
absorboida
mutista
tapella
paukkua
seurata
sopeuttaa
edetä
vihkiä
kesannoida
suodattaa
meluta
ihastuttaa
todeta
järjestää
paiskautua
poiketa
palkita
sihistä
muhentaa
hakata
murehtia
särkeä
yllättää
pystyttää
laittaa
leikata
kuivata
hivuttaa
jutustella
pyrkiä
mennä
arkailla
kuivua
mädäntyä
vajota
pestä
hankkia
pyytää
desinfioida
tuntea
poistua
mahtailla
hinata
musertaa
photoshopata
esiintyä
torkkua
pyytää
tyynnyttää
lingota
armahtaa
hypistellä
kunnioittaa
korjauttaa
käsitellä
pakata
katsoa
ottaa
kiinnittää
hivellä
muuttua
paistaa
kutsua
murehduttaa
siksakata
päästä
juoda
mäskätä
käydä
osata
täristää
tarjota
laskea
äristä
jättää
säästää
hankkia
masentua
kurittaa
suurustaa
muodostaa
haista
asettaa
24 changes: 24 additions & 0 deletions test/generate_sentences.py
Original file line number Diff line number Diff line change
@@ -0,0 +1,24 @@
#encoding: utf-8
from syntaxmaker.syntax_maker import *
import codecs

f = codecs.open("100verbs.txt", "r", encoding="utf-8")
results = []
for verb in f:
verb = verb.replace("\n", "")
vp = create_verb_pharse(verb)
components= vp.components.keys()
valency = str(len(components))
if u"subject" in components:
vp.components["subject"] = create_phrase("NP", "lehmä")
if u"dir_object" in components:
vp.components["dir_object"] = create_phrase("NP", "koira")
if u"indir_object" in components:
vp.components["indir_object"] = create_phrase("NP", "kissa")
phrase = vp.to_string()
results.append([verb, phrase.decode('utf-8'), valency])

fo = codecs.open("results.csv", "w", encoding="utf-8")
for result in results:
fo.write(";".join(result) + "\n")
fo.close()
100 changes: 100 additions & 0 deletions test/results.csv
Original file line number Diff line number Diff line change
@@ -0,0 +1,100 @@
suorittaa;lehmä suorittaa koiran;2
ilmaista;lehmä ilmaisee koiraa;2
kummuta;lehmä kumpuaa koirasta;2
tasata;lehmä tasaa koiraa;2
tehdä;lehmä tekee;1
pohtia;lehmä pohtii koiraa;2
säännöstellä;lehmä säännöstelee;1
hakea;lehmä hakee koiraa;2
siirtää;lehmä siirtää;1
sonnustautua;lehmä sonnustautuu koiraan;2
järistä;lehmä järisee;1
uskoa;lehmä uskoo koiraan;2
henkilöidä;lehmä henkilöi;1
ruuhkauttaa;lehmä ruuhkauttaa koiraa;2
myrskytä;lehmä myrskyää;1
hämmästyttää;lehmä hämmästyttää;1
subventoida;lehmä subventoi koiraa;2
absorboida;lehmä absorboi koiraa;2
mutista;lehmä mutisee koirasta;2
tapella;lehmä tappelee;1
paukkua;lehmä paukkuu;1
seurata;lehmä seuraa koiraa;2
sopeuttaa;lehmä sopeuttaa koiraan;2
edetä;lehmä etenee;1
vihkiä;lehmä vihkii;1
kesannoida;lehmä kesannoi;1
suodattaa;lehmä suodattaa koiraa;2
meluta;lehmä meluaa koiraa;2
ihastuttaa;lehmä ihastuttaa koiraa;2
todeta;lehmä toteaa;1
järjestää;lehmä järjestää;1
paiskautua;lehmä paiskautuu koiraan;2
poiketa;lehmä poikkeaa koirasta;2
palkita;lehmä palkitsee koiran;2
sihistä;lehmä sihisee;1
muhentaa;lehmä muhentaa koiraa kissaan;3
hakata;lehmä hakkaa koiraa;2
murehtia;lehmä murehtii koiraa;2
särkeä;lehmä särkee;1
yllättää;lehmä yllättää;1
pystyttää;lehmä pystyttää;1
laittaa;lehmä laittaa koiran kissaan;3
leikata;lehmä leikkaa koiraa;2
kuivata;lehmä kuivaa koiraa;2
hivuttaa;lehmä hivuttaa koiraa;2
jutustella;lehmä jutustelee;1
pyrkiä;lehmä pyrkii;1
mennä;lehmä menee;1
arkailla;lehmä arkailee koiraa;2
kuivua;lehmä kuivuu;1
mädäntyä;lehmä mädäntyy;1
vajota;lehmä vajoaa koiraan;2
pestä;lehmä pesee;1
hankkia;lehmä hankkii koiran;2
pyytää;lehmä pyytää;1
desinfioida;lehmä desinfioi koiran;2
tuntea;lehmä tuntee koiraa;2
poistua;lehmä poistuu koirasta;2
mahtailla;lehmä mahtailee;1
hinata;lehmä hinaa koiraa kissaan;3
musertaa;lehmä musertaa koiran;2
photoshopata;lehmä photoshopata koiraa kissaan;3
esiintyä;lehmä esiintyy;1
torkkua;lehmä torkkuu koiran;2
pyytää;lehmä pyytää;1
tyynnyttää;lehmä tyynnyttää;1
lingota;lehmä linkoaa koiran kissaan;3
armahtaa;lehmä armahtaa koiraa;2
hypistellä;lehmä hypistelee;1
kunnioittaa;lehmä kunnioittaa koiraa;2
korjauttaa;lehmä korjauttaa koiran;2
käsitellä;lehmä käsittelee;1
pakata;lehmä pakkaa koiraan;2
katsoa;lehmä katsoo koiraa;2
ottaa;lehmä ottaa;1
kiinnittää;lehmä kiinnittää;1
hivellä;lehmä hivelee;1
muuttua;lehmä muuttuu;1
paistaa;lehmä paistaa koiraa;2
kutsua;lehmä kutsuu;1
murehduttaa;lehmä murehduttaa koiraa;2
siksakata;lehmä siksakkaa koiraa kissalle;3
päästä;lehmä pääsee;1
juoda;lehmä juo koiraa;2
mäskätä;lehmä mäskää;1
käydä;lehmä käy;1
osata;lehmä osaa koiraa;2
täristää;lehmä täristää;1
tarjota;lehmä tarjoaa koiraa;2
laskea;lehmä laskee koiraa;2
äristä;lehmä ärisee;1
jättää;lehmä jättää;1
säästää;lehmä säästää;1
hankkia;lehmä hankkii koiran;2
masentua;lehmä masentuu koirasta;2
kurittaa;lehmä kurittaa koiraa;2
suurustaa;lehmä suurustaa koiraa;2
muodostaa;lehmä muodostaa;1
haista;lehmä haisee;1
asettaa;lehmä asettaa koiran kissalle;3
Binary file added test/results.xlsx
Binary file not shown.
29 changes: 29 additions & 0 deletions test/wiktionary_verbs.py
Original file line number Diff line number Diff line change
@@ -0,0 +1,29 @@
import codecs
import random
f = codecs.open("fiwiktionary-latest-pages-articles.xml", "r", encoding="utf-8")
seen_verb = False
verbs = []
for line in f:
if line.startswith(u"===Verbi==="):
seen_verb = True
elif "{{" in line or ":" in line:
pass
elif seen_verb and line.startswith(u"#") and "{{" not in line:
verb = line.replace("#", "").replace("[", "").replace("]","").replace("\n","")
verb = verb.strip()
if "<" in verb:
verb = verb.split("<")[0]
if "," not in verb:
if " " in verb:
verb = verb.split(" ")[0]
verbs.append(verb)
else:
verbs.extend(verb.split(","))
seen_verb = False

verbs = list(set(verbs))
random.shuffle(verbs)
fo = codecs.open("verbs.txt", "w", encoding="utf-8")
for verb in verbs:
fo.write(verb.strip() + "\n")
fo.close()
26 changes: 26 additions & 0 deletions testi.py
Original file line number Diff line number Diff line change
@@ -0,0 +1,26 @@
#encoding: utf-8
from syntax_maker import *

vp = create_verb_pharse("uneksia")
add_auxiliary_verb_to_vp(vp)



subject = create_phrase("NP", "rantaleijona", {u"PERS": "3", u"NUM": "PL"})


dobject = create_phrase("NP", "aalto", {u"PERS": "3", u"NUM": "PL"})
dobject.components["attribute"] = create_phrase("AP", "korkea")

dobject.components["attribute"].components["attribute"] = create_phrase("AdvP", "erittäin")


vp.order.insert(0, "Advl")
advl = {u"CASE": "Ess" }
vp.governance["Advl"] = advl
vp.components["Advl"] = create_phrase("NP","hipsteri",{u"PERS": "3", u"NUM": "PL"})

vp.components["subject"] = subject
vp.components["dir_object"] = dobject

print vp

0 comments on commit 599ed85

Please sign in to comment.