-
-
Notifications
You must be signed in to change notification settings - Fork 4
Commit
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
- Loading branch information
Hämäläinen, Mika K
committed
Dec 15, 2017
1 parent
ed64a64
commit 599ed85
Showing
6 changed files
with
279 additions
and
0 deletions.
There are no files selected for viewing
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,100 @@ | ||
suorittaa | ||
ilmaista | ||
kummuta | ||
tasata | ||
tehdä | ||
pohtia | ||
säännöstellä | ||
hakea | ||
siirtää | ||
sonnustautua | ||
järistä | ||
uskoa | ||
henkilöidä | ||
ruuhkauttaa | ||
myrskytä | ||
hämmästyttää | ||
subventoida | ||
absorboida | ||
mutista | ||
tapella | ||
paukkua | ||
seurata | ||
sopeuttaa | ||
edetä | ||
vihkiä | ||
kesannoida | ||
suodattaa | ||
meluta | ||
ihastuttaa | ||
todeta | ||
järjestää | ||
paiskautua | ||
poiketa | ||
palkita | ||
sihistä | ||
muhentaa | ||
hakata | ||
murehtia | ||
särkeä | ||
yllättää | ||
pystyttää | ||
laittaa | ||
leikata | ||
kuivata | ||
hivuttaa | ||
jutustella | ||
pyrkiä | ||
mennä | ||
arkailla | ||
kuivua | ||
mädäntyä | ||
vajota | ||
pestä | ||
hankkia | ||
pyytää | ||
desinfioida | ||
tuntea | ||
poistua | ||
mahtailla | ||
hinata | ||
musertaa | ||
photoshopata | ||
esiintyä | ||
torkkua | ||
pyytää | ||
tyynnyttää | ||
lingota | ||
armahtaa | ||
hypistellä | ||
kunnioittaa | ||
korjauttaa | ||
käsitellä | ||
pakata | ||
katsoa | ||
ottaa | ||
kiinnittää | ||
hivellä | ||
muuttua | ||
paistaa | ||
kutsua | ||
murehduttaa | ||
siksakata | ||
päästä | ||
juoda | ||
mäskätä | ||
käydä | ||
osata | ||
täristää | ||
tarjota | ||
laskea | ||
äristä | ||
jättää | ||
säästää | ||
hankkia | ||
masentua | ||
kurittaa | ||
suurustaa | ||
muodostaa | ||
haista | ||
asettaa |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,24 @@ | ||
#encoding: utf-8 | ||
from syntaxmaker.syntax_maker import * | ||
import codecs | ||
|
||
f = codecs.open("100verbs.txt", "r", encoding="utf-8") | ||
results = [] | ||
for verb in f: | ||
verb = verb.replace("\n", "") | ||
vp = create_verb_pharse(verb) | ||
components= vp.components.keys() | ||
valency = str(len(components)) | ||
if u"subject" in components: | ||
vp.components["subject"] = create_phrase("NP", "lehmä") | ||
if u"dir_object" in components: | ||
vp.components["dir_object"] = create_phrase("NP", "koira") | ||
if u"indir_object" in components: | ||
vp.components["indir_object"] = create_phrase("NP", "kissa") | ||
phrase = vp.to_string() | ||
results.append([verb, phrase.decode('utf-8'), valency]) | ||
|
||
fo = codecs.open("results.csv", "w", encoding="utf-8") | ||
for result in results: | ||
fo.write(";".join(result) + "\n") | ||
fo.close() |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,100 @@ | ||
suorittaa;lehmä suorittaa koiran;2 | ||
ilmaista;lehmä ilmaisee koiraa;2 | ||
kummuta;lehmä kumpuaa koirasta;2 | ||
tasata;lehmä tasaa koiraa;2 | ||
tehdä;lehmä tekee;1 | ||
pohtia;lehmä pohtii koiraa;2 | ||
säännöstellä;lehmä säännöstelee;1 | ||
hakea;lehmä hakee koiraa;2 | ||
siirtää;lehmä siirtää;1 | ||
sonnustautua;lehmä sonnustautuu koiraan;2 | ||
järistä;lehmä järisee;1 | ||
uskoa;lehmä uskoo koiraan;2 | ||
henkilöidä;lehmä henkilöi;1 | ||
ruuhkauttaa;lehmä ruuhkauttaa koiraa;2 | ||
myrskytä;lehmä myrskyää;1 | ||
hämmästyttää;lehmä hämmästyttää;1 | ||
subventoida;lehmä subventoi koiraa;2 | ||
absorboida;lehmä absorboi koiraa;2 | ||
mutista;lehmä mutisee koirasta;2 | ||
tapella;lehmä tappelee;1 | ||
paukkua;lehmä paukkuu;1 | ||
seurata;lehmä seuraa koiraa;2 | ||
sopeuttaa;lehmä sopeuttaa koiraan;2 | ||
edetä;lehmä etenee;1 | ||
vihkiä;lehmä vihkii;1 | ||
kesannoida;lehmä kesannoi;1 | ||
suodattaa;lehmä suodattaa koiraa;2 | ||
meluta;lehmä meluaa koiraa;2 | ||
ihastuttaa;lehmä ihastuttaa koiraa;2 | ||
todeta;lehmä toteaa;1 | ||
järjestää;lehmä järjestää;1 | ||
paiskautua;lehmä paiskautuu koiraan;2 | ||
poiketa;lehmä poikkeaa koirasta;2 | ||
palkita;lehmä palkitsee koiran;2 | ||
sihistä;lehmä sihisee;1 | ||
muhentaa;lehmä muhentaa koiraa kissaan;3 | ||
hakata;lehmä hakkaa koiraa;2 | ||
murehtia;lehmä murehtii koiraa;2 | ||
särkeä;lehmä särkee;1 | ||
yllättää;lehmä yllättää;1 | ||
pystyttää;lehmä pystyttää;1 | ||
laittaa;lehmä laittaa koiran kissaan;3 | ||
leikata;lehmä leikkaa koiraa;2 | ||
kuivata;lehmä kuivaa koiraa;2 | ||
hivuttaa;lehmä hivuttaa koiraa;2 | ||
jutustella;lehmä jutustelee;1 | ||
pyrkiä;lehmä pyrkii;1 | ||
mennä;lehmä menee;1 | ||
arkailla;lehmä arkailee koiraa;2 | ||
kuivua;lehmä kuivuu;1 | ||
mädäntyä;lehmä mädäntyy;1 | ||
vajota;lehmä vajoaa koiraan;2 | ||
pestä;lehmä pesee;1 | ||
hankkia;lehmä hankkii koiran;2 | ||
pyytää;lehmä pyytää;1 | ||
desinfioida;lehmä desinfioi koiran;2 | ||
tuntea;lehmä tuntee koiraa;2 | ||
poistua;lehmä poistuu koirasta;2 | ||
mahtailla;lehmä mahtailee;1 | ||
hinata;lehmä hinaa koiraa kissaan;3 | ||
musertaa;lehmä musertaa koiran;2 | ||
photoshopata;lehmä photoshopata koiraa kissaan;3 | ||
esiintyä;lehmä esiintyy;1 | ||
torkkua;lehmä torkkuu koiran;2 | ||
pyytää;lehmä pyytää;1 | ||
tyynnyttää;lehmä tyynnyttää;1 | ||
lingota;lehmä linkoaa koiran kissaan;3 | ||
armahtaa;lehmä armahtaa koiraa;2 | ||
hypistellä;lehmä hypistelee;1 | ||
kunnioittaa;lehmä kunnioittaa koiraa;2 | ||
korjauttaa;lehmä korjauttaa koiran;2 | ||
käsitellä;lehmä käsittelee;1 | ||
pakata;lehmä pakkaa koiraan;2 | ||
katsoa;lehmä katsoo koiraa;2 | ||
ottaa;lehmä ottaa;1 | ||
kiinnittää;lehmä kiinnittää;1 | ||
hivellä;lehmä hivelee;1 | ||
muuttua;lehmä muuttuu;1 | ||
paistaa;lehmä paistaa koiraa;2 | ||
kutsua;lehmä kutsuu;1 | ||
murehduttaa;lehmä murehduttaa koiraa;2 | ||
siksakata;lehmä siksakkaa koiraa kissalle;3 | ||
päästä;lehmä pääsee;1 | ||
juoda;lehmä juo koiraa;2 | ||
mäskätä;lehmä mäskää;1 | ||
käydä;lehmä käy;1 | ||
osata;lehmä osaa koiraa;2 | ||
täristää;lehmä täristää;1 | ||
tarjota;lehmä tarjoaa koiraa;2 | ||
laskea;lehmä laskee koiraa;2 | ||
äristä;lehmä ärisee;1 | ||
jättää;lehmä jättää;1 | ||
säästää;lehmä säästää;1 | ||
hankkia;lehmä hankkii koiran;2 | ||
masentua;lehmä masentuu koirasta;2 | ||
kurittaa;lehmä kurittaa koiraa;2 | ||
suurustaa;lehmä suurustaa koiraa;2 | ||
muodostaa;lehmä muodostaa;1 | ||
haista;lehmä haisee;1 | ||
asettaa;lehmä asettaa koiran kissalle;3 |
Binary file not shown.
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,29 @@ | ||
import codecs | ||
import random | ||
f = codecs.open("fiwiktionary-latest-pages-articles.xml", "r", encoding="utf-8") | ||
seen_verb = False | ||
verbs = [] | ||
for line in f: | ||
if line.startswith(u"===Verbi==="): | ||
seen_verb = True | ||
elif "{{" in line or ":" in line: | ||
pass | ||
elif seen_verb and line.startswith(u"#") and "{{" not in line: | ||
verb = line.replace("#", "").replace("[", "").replace("]","").replace("\n","") | ||
verb = verb.strip() | ||
if "<" in verb: | ||
verb = verb.split("<")[0] | ||
if "," not in verb: | ||
if " " in verb: | ||
verb = verb.split(" ")[0] | ||
verbs.append(verb) | ||
else: | ||
verbs.extend(verb.split(",")) | ||
seen_verb = False | ||
|
||
verbs = list(set(verbs)) | ||
random.shuffle(verbs) | ||
fo = codecs.open("verbs.txt", "w", encoding="utf-8") | ||
for verb in verbs: | ||
fo.write(verb.strip() + "\n") | ||
fo.close() |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,26 @@ | ||
#encoding: utf-8 | ||
from syntax_maker import * | ||
|
||
vp = create_verb_pharse("uneksia") | ||
add_auxiliary_verb_to_vp(vp) | ||
|
||
|
||
|
||
subject = create_phrase("NP", "rantaleijona", {u"PERS": "3", u"NUM": "PL"}) | ||
|
||
|
||
dobject = create_phrase("NP", "aalto", {u"PERS": "3", u"NUM": "PL"}) | ||
dobject.components["attribute"] = create_phrase("AP", "korkea") | ||
|
||
dobject.components["attribute"].components["attribute"] = create_phrase("AdvP", "erittäin") | ||
|
||
|
||
vp.order.insert(0, "Advl") | ||
advl = {u"CASE": "Ess" } | ||
vp.governance["Advl"] = advl | ||
vp.components["Advl"] = create_phrase("NP","hipsteri",{u"PERS": "3", u"NUM": "PL"}) | ||
|
||
vp.components["subject"] = subject | ||
vp.components["dir_object"] = dobject | ||
|
||
print vp |