Some checks failed
Docker. / Ubuntu (push) Has been cancelled
User-agent updater. / User-agent (push) Failing after 15s
Lock Threads / lock (push) Failing after 10s
Waiting for answer. / waiting-for-answer (push) Failing after 22s
Needs user action. / needs-user-action (push) Failing after 8s
Can't reproduce. / cant-reproduce (push) Failing after 8s
Close stale issues and PRs / stale (push) Has been cancelled
440 lines
16 KiB
Groff
440 lines
16 KiB
Groff
.hla hu
|
||
.TH hunspell 1 "2014. május 27."
|
||
.LO 1
|
||
.SH NÉV
|
||
hunspell \- unicode-os helyesírás\-ellenőrző, szótövező és morfológiai elemző program
|
||
.SH ÁTTEKINTÉS
|
||
hunspell [\-1aDGHhLlmnOstvwX] [\-\-check\-url] [\-\-check\-apostrophe] [\-\-help] [\-i karakterkódolás] [\-d szótár[,...]] [\-p sajátszótár] [szöveges/OpenDocument/TeX/LaTeX/HTML/SGML/XML/nroff/troff állomány(ok)]
|
||
.SH LEÍRÁS
|
||
A
|
||
.B hunspell
|
||
felismeri és javítja az elütéseket és típushibákat
|
||
egyszerű szöveges, OpenDocument, (La)TeX, XML, HTML és groff (kézikönyv oldal) állományokban.
|
||
.PP
|
||
Ha nem adunk meg állománynév-paramétert, a Hunspell az Ispell
|
||
csőfelületéhez hasonlóan működik: a bemenet sorait szavakra bontja,
|
||
és *, +, vagy - jellel kezdődő kimeneti sorral jelzi, ha egy szó jó,
|
||
és # vagy & jellel, ha rossz. A csőfelület parancsait viszont az
|
||
Ispellhez hasonlóan csak a
|
||
.I \-a
|
||
kapcsoló megadásával értelmezi.
|
||
.PP
|
||
Állománynév paraméter esetén elindul egy az Ispelléhez hasonló interaktív felület.
|
||
.SH KAPCSOLÓK
|
||
.TP
|
||
.B \-1
|
||
Speciális formátum: a bemeneti állomány tabulátorjelet tartalmazó soraiból csak az
|
||
első tabulátorjel előtti karaktersorozatot vizsgálja meg.
|
||
.TP
|
||
.B \-a
|
||
Ispellhez csőfelület. A
|
||
.I !,
|
||
.I +,
|
||
.I \-,
|
||
.I \@,
|
||
.I #,
|
||
vagy
|
||
.I ^
|
||
jellel kezdődő sorok a csőfelület parancsai, jelentésüket
|
||
az Ispell kézikönyvoldal részletezi. A \-a kapcsoló
|
||
hatására a kimenetben a jó szavakat csak csillaggal jelzi
|
||
a Hunspell. Ez nagyobb kompatibilitást biztosít az Ispellt használó programok
|
||
némelyikével (például a LyX-szel). Ekkor nem kell
|
||
megadnunk a \-a kapcsolót, mivel az Ispellt
|
||
használó programok automatikusan ezzel a kapcsolóval indítják
|
||
el az Ispell nevében futó Hunspellt is.
|
||
.TP
|
||
.B \-d " szótár[,szótár2,...]"
|
||
Beállítja a helyesírási szótárakat a
|
||
kiterjesztés nélküli szótárnevek, útvonalak
|
||
megadásával.
|
||
|
||
Például a
|
||
.PP
|
||
hunspell \-d hu_HU,hu_geo,hu_med,de_DE,de_med
|
||
.PP
|
||
a magyar alapszótárat és kiegészítő szótárait,
|
||
valamint német alapszótárat és annak egy kiegészítő
|
||
szótárát tölti be. Az alapszótárak egy aff és egy dic
|
||
kiterjesztésű állományból állnak, a kiegészítő szótárak
|
||
csak dic állományból. A kiegészítő szótárak
|
||
nevére vonatkozóan nincs szabály (csak a dic kiterjesztés),
|
||
a szótárnevek sorrendje határozza meg, hogy melyik alapszótárhoz
|
||
töltődnek be a kiegészítő szótárak (ami pedig meghatározza
|
||
a javaslattevést). Az első szótár mindig alapszótár.
|
||
.PP
|
||
Az alapértelmezett szótár a környezet nyelvi beállításától függ
|
||
az Unix rendszereken. Locale hiányában a
|
||
.BR /usr/share/hunspell/default
|
||
az alapértelmezett szótár.
|
||
.PP
|
||
A megadott útvonal lehet abszolút és relatív is. Relatív
|
||
útvonal esetén először az aktuális, majd a
|
||
.BR /usr/share/hunspell
|
||
és még több más könyvtárban keresi a szótárt a program. L. \-D és a
|
||
.BR PÉLDÁK.
|
||
.TP
|
||
.B \-D
|
||
A keresési útvonalak, az elérhető és betöltött szótárak útvonalának
|
||
kijelzése.
|
||
.TP
|
||
.B \-G
|
||
A \-l, \-w, és \-L kapcsolókat kiegészítő kapcsoló. A standard bemenetről
|
||
érkező hibás szavak, illetve
|
||
sorok megjelenítése helyett a jó szavak és a hibátlan sorok megjelenítését
|
||
kérhetjük vele. Ha mást nem adunk meg, a \-l kapcsoló hatásának megfelelően
|
||
működik, csak a rossz helyett a jó szavakat írja a standard kimenetre.
|
||
.TP
|
||
.B \-h, \-\-help
|
||
A beépített leírás megjelenítése.
|
||
.TP
|
||
.B \-H
|
||
HTML bemeneti állományformátum beállítása. Ha az állomány
|
||
nevének .html vagy .htm a kiterjesztése, ez automatikusan bekövetkezik.
|
||
.TP
|
||
.B \-l
|
||
Kiírja a hibás szavakat a standard bemenetről érkező állományból.
|
||
Használható a \-H, \-t, \-n, \-1 kapcsolókkal együtt is. A \-G kapcsoló
|
||
megfordítja a Hunspell működését: csak a jó szavak kerülnek kiírásra.
|
||
.TP
|
||
.B \-L
|
||
Csak a hibás szavakat tartalmazó sorokat írja ki a standard bemenetről érkező állományból.
|
||
Használható a \-H, \-t, \-n, \-1 kapcsolókkal együtt is. A \-G kapcsoló
|
||
megfordítja a működését: csak azok a sorok kerülnek kiírásra, amelyek egy
|
||
hibás szót sem tartalmaznak.
|
||
.TP
|
||
.B \-m
|
||
Elemző üzemmód: a bemeneti szövegszavak morfológia elemzése, illetve a szótári
|
||
morfológiai leírás hiányában a toldalékolt szavak kapcsolóinak
|
||
kijelzése (szótárfejlesztőknek).
|
||
.TP
|
||
.B \-n
|
||
Nroff/troff bemeneti állományformátum beállítása, elsősorban a
|
||
kézikönyvlapok ellenőrzésére.
|
||
.TP
|
||
.B \-O
|
||
OpenDocument (ODF vagy flat ODF) bemeneti állományformátum beállítása. Ha az állomány
|
||
nevének .odt, .ods, .odp, .odg, illetve ezek sablon (.ott, ...) vagy flat (.fodt, ...)
|
||
változatainak megfelelő a kiterjesztése, ez automatikusan bekövetkezik.
|
||
Ha még nem volna, telepítsük az unzip programot a kapcsoló használata előtt.
|
||
.TP
|
||
.B \-p " saját_szótár"
|
||
A felhasználó saját szótárának beállítására szolgál.
|
||
|
||
Az alapértelmezett saját szótár a
|
||
.BR $HOME/.hunspell_default
|
||
állomány. Ha szótárat is megadunk a
|
||
.I \-d
|
||
kapcsolóval, vagy a
|
||
.I DICTIONARY
|
||
környezeti változóval, a saját szótár a
|
||
.BR $HOME/.hunspell_szótárnév
|
||
lesz. Ha a saját szótár nem létezik, létrehozza.
|
||
|
||
Ha az aktuális könyvtárban is van egy ugyanilyen nevű
|
||
állomány, akkor annak tartalma is beolvasásra kerül,
|
||
mint saját szótár, és az újonnan felvett szavak is
|
||
ide kerülnek.
|
||
|
||
A
|
||
.I \-p ,
|
||
vagy a
|
||
.I WORDLIST
|
||
környezeti változó megadásával új saját szótárat
|
||
jelölünk ki. A saját szótárat az aktuális könyvtárban,
|
||
és a saját könyvtár gyökerében ($HOME) keresi a
|
||
Hunspell. Ha nem található, akkor az újonnan felvett
|
||
szavak mentésénél létrehozza a saját könyvtár gyökerében.
|
||
.TP
|
||
.B \-s
|
||
Tövező üzemmód: a bemenő szövegszavak tövezése (a szótártól függő
|
||
pontossággal).
|
||
.TP
|
||
.B \-t
|
||
LaTeX bemeneti állományformátum beállítása. Ha az állomány nevének .tex
|
||
a kiterjesztése, ez automatikusan bekövetkezik.
|
||
.TP
|
||
.B \-u
|
||
Tipikus hibák kijelzése az állományból, cserejavaslattal.
|
||
.TP
|
||
.B \-u2
|
||
Tipikus hibák és javításuk kijelzése módosítható, és a
|
||
sed programmal végrehajtatható formában.
|
||
Irányítsuk a Hunspell kimenetét egy állományba.
|
||
Törüljük azokat a sorokat az elmentett állományból,
|
||
amelyek sed paranccsal megadott javítását nem szeretnénk.
|
||
Mentsük el az állományt, és
|
||
a \fIsed -f javítás eredeti_állomány >javított_állomány\fR
|
||
paranccsal javíthatjuk az állományt gyorsan
|
||
és egyszerűen. (A sok hibát tartalmazó állományok
|
||
javítását gyorsítja meg ez a lehetőség.)
|
||
.TP
|
||
.B \-U
|
||
Ha az -u kapcsolóval kapott javaslatokat mind el szeretnénk fogadni,
|
||
akkor az \-U kapcsolóval a Hunspell automatikusan
|
||
végrehajtja a cseréket, és a módosított állományt
|
||
a szabványos kimenetre küldi. Példa a javításra:
|
||
\fIhunspell -U eredeti_állomány >javított_állomány\fR.
|
||
A hibakimeneten megjelennek a javítások is még egyszer, a
|
||
-\u kapcsolóhoz hasonló módon.
|
||
.TP
|
||
.B \-v
|
||
Verziószám.
|
||
.TP
|
||
.B \-vv
|
||
Verziószám (Ispell kompatibilitás miatt).
|
||
.TP
|
||
.B \-w
|
||
Csak a hibás szavakat írja ki a standard bemenetről érkező, soronként
|
||
egy szót tartalmazó állományból. A sorok nincsenek szavakra
|
||
bontva. A sorok szavakra bontása, és csak a hibás szavak kiírása a \-w kapcsolóval
|
||
érhető el. A \-G kapcsoló megfordítja a Hunspell működését: csak a jó szavak kerülnek
|
||
kiírásra.
|
||
.TP
|
||
.B \-X
|
||
XML bemeneti állományformátum beállítása. Ha az állomány
|
||
nevének .xml a kiterjesztése, ez automatikusan bekövetkezik.
|
||
.SH INTERAKTÍV FELÜLET
|
||
A felület legfelső sorában a hibás szóalakot, és az éppen vizsgált
|
||
állomány nevét látjuk. Amennyiben egy szóalak szótári tiltás
|
||
miatt nem kerül elfogadásra, a bal felső sarokban a TILTOTT!
|
||
(FORBIDDEN!) üzenet is megjelenik. Ez az üzenet arra utal, hogy nem
|
||
hiányos szókincs, hanem szándékos tiltás miatt nem került a szó
|
||
elfogadásra. Az első sor alatt az állomány hibás szót tartalmazó sorát, és
|
||
szövegkörnyezetét láthatjuk, majd ezt követik a javaslatok, ha vannak.
|
||
.PP
|
||
A használható billentyűkombinációk:
|
||
.TP
|
||
.B Szóköz
|
||
Továbblépés javítás nélkül a következő hibás szóra.
|
||
.TP
|
||
.B Számok
|
||
A megfelelő javaslat kiválasztása.
|
||
.TP
|
||
.B c
|
||
Csere. A hibás szó cseréje a megadott szóra, vagy szavakra.
|
||
Az Escape billentyű kétszeri lenyomásával megszakíthatjuk a
|
||
a cserét.
|
||
.TP
|
||
.B j
|
||
A szó elfogadása a program futásának befejeződéséig.
|
||
.TP
|
||
.B f
|
||
A szó felvétele a saját szótárba.
|
||
.TP
|
||
.B k
|
||
A szó kisbetűsként való felvétele a saját szótárba.
|
||
.TP
|
||
.B t
|
||
Ragozott tőszó felvétele. A ragozás a másodikként
|
||
megadott, mintául szolgáló szó alapján történik.
|
||
Ha ez a szó nincs felvéve a szótárba, a tőszófelvételt
|
||
elölről kell kezdeni.
|
||
|
||
Példa: gyakran hiányoznak az idegen és a
|
||
mozaikszavak. Vegyük fel a hiányzó OTP szót
|
||
a tv köznévi mozaikszó toldalékaival!
|
||
Lenyomjuk a t billentyűt, beírjuk, hogy OTP,
|
||
leütjük az új sor billentyűt, beírjuk, hogy tv, és ismét új sor. A tv szó
|
||
ugyanis már szerepel a szótárban, és ragozása
|
||
mondja meg a programnak, hogy az OTP szót
|
||
milyen toldalékokkal szeretnénk látni, pl.
|
||
OTP\-hez, OTP\-met stb. a tv\-hez, tv\-met mintájára.
|
||
A \-val/\-vel, \-vá/\-vé toldalékokat
|
||
a kötőjellel kapcsolt toldalékú szavak
|
||
esetében külön kell felvenni, de még így is sokkal
|
||
kényelmesebb a speciális tőfelvétel, mint minden
|
||
(akár több száz) toldalékos alakot külön\-külön
|
||
felvenni.
|
||
|
||
Egy kis segítség a minta kiválasztásához:
|
||
első menetben a hangrend számít. Pl. mozaikszavaknál a
|
||
mély hangrendű új szavak felvételénél használhatjuk
|
||
a \fIMÁV\fR szót példaként, ajakréses magas hangrendnél
|
||
pedig az említett \fItv\fR\-t. Ajakkerekítéses magas hangrend
|
||
esetében a \fIHÖK\fR szót használhatjuk (amíg át nem
|
||
lesz javítva a helyes hök\-re). Ha a hiányzó
|
||
szó nem mozaikszó, hanem például tulajdonnév,
|
||
a \fIPál\fR, \fIPéter\fR, \fIÖrs\fR szavakat adhatjuk
|
||
meg példának a hangrendtől függően. Ha meg
|
||
egyszerű köznévről van szó, akkor használjuk az
|
||
\fIok\fR, \fIék\fR, \fIük\fR szavakat.
|
||
Igéknél \fIáll\fR, \fIvél\fR, \fIül\fR,
|
||
ikes igéknél \fIázik\fR, \fIvérzik\fR, \fInőzik\fR
|
||
lehet a példa (remélhetőleg a következő
|
||
változatokban egyszerűsödik ez a tőfelvétel).
|
||
|
||
Az Escape billentyű kétszeri lenyomásával megszakíthatjuk ezt
|
||
a műveletet.
|
||
|
||
Az itt felvett szavak automatikusan a saját
|
||
szótárba kerülnek. Ha ezt innen törölni
|
||
szeretnénk, a programból kilépve
|
||
a saját szótár kézi átszerkesztésével tehetjük meg.
|
||
|
||
.TP
|
||
.B m
|
||
Kilépés a változtatások mentése nélkül. A program
|
||
változtatás megléte esetén megerősítést kér.
|
||
.TP
|
||
.B v
|
||
Az állomány ellenőrzésének megszakítása a változtatások
|
||
mentésével. Ha van következő állomány, akkor
|
||
a program annak ellenőrzését kezdi el.
|
||
.TP
|
||
.B ?
|
||
Segítség. Hasonló rövid leírás megjelenítése a
|
||
billentyűparancsokról.
|
||
.SH CSŐFELÜLET
|
||
A \fIHunspell \fR soronként dolgozza fel az
|
||
állományokat, a helyes szavakat \fI*\fR (tőszó), \fI\-\fR
|
||
(összetett szó), vagy
|
||
.I +
|
||
(ragozott szó) karakterrel jelöli, a helyteleneket
|
||
.I #
|
||
(nincs javaslat) , vagy
|
||
.I &
|
||
(van javaslat) karakterrel. A + jelet a kimenetben követi még a szótő.
|
||
A # jel után a hibás szó, és kezdőpozíciója van feltüntetve.
|
||
A & jelet követi a hibás szó; a javaslatok száma; a hibás szó
|
||
kezdőpozíciója; majd kettőspont után a javaslatok, vesszővel elválasztva:
|
||
.PP
|
||
.RS
|
||
.nf
|
||
macska
|
||
*
|
||
macskabajusz
|
||
-
|
||
macskák
|
||
+ macska
|
||
mcsk
|
||
# mcsk 0
|
||
macka
|
||
& macka 7 0: macska, maca, racka, packa, vacka, marka, mackó
|
||
.fi
|
||
.RS
|
||
.SH PÉLDÁK
|
||
.TP
|
||
.B hunspell \-d en_US english.html
|
||
Az amerikai angol helyesírási szótár kiválasztása (aktuális, vagy a
|
||
.BR /usr/share/hunspell
|
||
könyvtárból.
|
||
.TP
|
||
.B hunspell -l szöveg.html
|
||
A megadott állomány hibás szavainak kiírása.
|
||
.TP
|
||
.B hunspell -l *.odt | sort | uniq >nem_ismert_szavak
|
||
Az aktuális könyvtárban található összes OpenDocument szöveges állomány
|
||
nem ismert szavainak állományba mentése (az ismétlődők kiszűrésével).
|
||
.TP
|
||
.B hunspell -p nem_ismert_szavak_de_jok *.odt
|
||
Az aktuális könyvtárban található OpenDocument szöveges állományok
|
||
interaktív ellenőrzése saját szótár megadásával. A példában szereplő
|
||
saját szótár nem más, mint az előzőleg elmentett nem_ismert_szavak állománya,
|
||
amelyekből kivettük azokat a szavakat, amelyeket most javítani szeretnénk.
|
||
.SH KÖRNYEZET
|
||
.TP
|
||
.B DICTIONARY
|
||
A szótár helyének megadására szolgál. Szerepe megegyezik a
|
||
.I \-d
|
||
kapcsolóval.
|
||
.TP
|
||
.B DICPATH
|
||
A szótárkeresési útvonalat tartalmazó változó.
|
||
.TP
|
||
.B WORDLIST
|
||
A saját szótár helyének megadására szolgál. Szerepe megegyezik a
|
||
.I \-p
|
||
kapcsolóval.
|
||
.SH ÁLLOMÁNYOK
|
||
.BI /usr/share/default.aff
|
||
Az alapértelmezett ragozási táblázat. Lásd hunspell(4).
|
||
.PP
|
||
.BI /usr/share/default.dic
|
||
Az alapértelmezett szótár az előző ragozási táblázathoz.
|
||
Lásd hunspell(4).
|
||
.BI $HOME/.hunspell_default
|
||
Az alapértelmezett saját szótár. Az állományt létrehozza
|
||
a Hunspell, ha nem létezik. Lásd ispell(1).
|
||
.SH LÁSD MÉG
|
||
.B hunspell (4),
|
||
.B hunstem (1),
|
||
.B makedb (1),
|
||
.B lookdb (1),
|
||
.B ispell (1),
|
||
.B ispell (4),
|
||
Magyar Ispell dokumentáció.
|
||
.SH ELŐNYÖK
|
||
A program a következő előnyöket nyújtja a hasonló célokat szolgáló \fIIspell\fR\-lel szemben:
|
||
.IP \-
|
||
Képzők átfogó ismerete. (Több tízezer helyes szóalak elfogadását tette
|
||
lehetővé a tesztelésre használt 4 millió szavas gyakorisági szótárban.)
|
||
.IP \-
|
||
Homonimák kezelése (nincsenek például olyan alakok elfogadva, mint megvárban).
|
||
.IP \-
|
||
Helyes javaslatok a több karakter változásával járó tipikus hibákra
|
||
(j/ly, íj/ijj, nyj/nny és még több tucatnyi tévesztés megvizsgálásával).
|
||
Az \fIIspell\fR csak két karakter felcserélése; vagy egy karakter hiánya,
|
||
cseréje, illetve felesleges jelenléte esetén ad helyes javaslatot.
|
||
.IP \-
|
||
Az összes helyes összetett szónak látszó, de tipikus hibával előálló alak tiltása (karvaj, színtű, súlytó stb.)
|
||
.IP \-
|
||
Javaslatok valószínűségi sorrendben jelennek meg (tipikus hibák, i/í, o/ó, u/ú tévesztések stb.).
|
||
.IP \-
|
||
Összetett szavak esetén 6–3\-as szabály alkalmazása (helyesírás\-ellenőrző, gépkocsi\-összeszerelés).
|
||
.IP \-
|
||
Mozgószabály alkalmazása (kiviteli engedély, kiviteliengedély\-kérés).
|
||
.IP \-
|
||
A magyar nyelv egyéb összetételi szabályainak alkalmazása (például hatlövetű, tizenkét lövetű, kéthavi, két hónapos, másodmagával).
|
||
.IP \-
|
||
Leg-, legesleg- és -bb confixum helyes kezelése (nincs pl. legédes, csak legédesebb).
|
||
.IP \-
|
||
Ragozható tőszófelvétel. Megkönnyíti egy új szó ragozott változatainak ellenőrzését, feleslegessé téve ezek külön\-külön történő felvételét a saját szótárba.
|
||
.IP \-
|
||
Javaslatok mássalhangzó\-triplázások (sakkkör, baletttáncos, dzsesszszak) esetén.
|
||
(Ispell helyesnek fogadja el ezeket.)
|
||
.IP \-
|
||
Javaslatok szótagduplázások (oktatatás, igenenevet) esetén.
|
||
.IP \-
|
||
Javaslatok ékezet nélküli szövegre (tukorfurogep\->tükörfúrógép).
|
||
.IP \-
|
||
Kötőjeles szavak kezelése (unos\-untalan).
|
||
.IP \-
|
||
Toldalékolt számok (1\-jén, 11\-én, 5.\-et) kezelése.
|
||
.IP \-
|
||
°, %, és § jelek (%\-kal) toldalékolt alakjainak kezelése.
|
||
.IP \-
|
||
Mozaikszavak (MÁV\-osokat) kezelése.
|
||
.IP \-
|
||
Y-ra végződő szavak (boyjal, pennyvel) kezelése.
|
||
.IP \-
|
||
Idegen ejtésű szótagra végződő szavak (Anonymusszal, Voltaire\-nek) kezelése.
|
||
.IP \-
|
||
Két szóból álló földrajzi nevek (San Franciscó\-i) kezelése.
|
||
.IP \-
|
||
Hibás alakok tiltása (Babitssal, tanit, alkotóművész stb.)
|
||
.IP \-
|
||
Tiltások jelzése a felhasználói felületen.
|
||
.IP \-
|
||
Egyéb (például az Ispell ragozott utószó esetében bármilyen szóösszetételt elfogad: macskatekerem, kutyakavarom, ezt a Hunspell nem teszi meg).
|
||
.IP \-
|
||
Magyar nyelvű (illetve
|
||
.B locale (7)
|
||
függő) felület.
|
||
.IP \-
|
||
Hordozható szöveges szótárállományok, szemben az Ispell platform, és bináris Ispell fordítástól függően (nem) kezelhető adatállományaival.
|
||
|
||
.SH SZERZŐ
|
||
A Hunspell az OpenOffice.org MySpell függvénykönyvtárán továbbfejlesztése.
|
||
A MySpell affixumtömörítésének mintája az International Ispell program volt.
|
||
.PP
|
||
A mintaként szolgáló International Ispell szerzője Geoff Kuenning,
|
||
sok más elődje munkájára támaszkodva (l. ispell(1)).
|
||
.PP
|
||
A Myspellt Kevin Hendricks készítette a legjelentősebb
|
||
nyílt forráskódú irodai csomaghoz, az OpenOffice.org-hoz 2001\-2002\-ben
|
||
(l. http://hu.openoffice.org).
|
||
.PP
|
||
A Hunspell programkönyvtárat és parancssori programot
|
||
Németh László <nemeth@openoffice PONT org> készítette 2002\-2008\-ban.
|