Strojevi-prevoditelji
Strojevi za SP mogu se klasificirati po svojoj arhitekturi - po općoj organizaciji procesiranja ili apstraktnom
uređenju različitih modula za procesiranje. Obično se SP bazira na direktnoj ili transformerskoj arhitekturi strojeva
i ovo je još uvijek arhitektura koju ćemo naći u mnogim popularnim komercijalnim sustavima za SP. Novija je indirektna
ili arhitektura lingvističkog znanja, koja dominira u istraživanju SP-a zadnjih godina i počinje biti dostupna u
komercijalnim oblicima.
Transformerska arhitektura
Glavni smisao transformerskih strojeva je da ulazne rečenice (izvorni jezik) mogu biti transformirane u izlazne
(ciljni jezik) najjednostavnijim mogućim rastavljanjem rečenice na njene sastavne dijelove, zamjenom izvornih riječi
s njihovim jezičnim ekvivalentima kao što je specificirano u dvojezičnom rječniku, i onda grubo sređivanje njihovog
poretka da bi odgovarao pravilima ciljnog jezika. Karakteristike transformerske arhitekture stroja su sljedeće:
- Oni su vrlo robustni. Stroj se ne "ruši" i ne prestaje raditi kad dođe do ulaza koji sadrži nepoznate riječi ili nepoznatu gramatičku konstrukciju. Robustnost je vrlo važna za SP opće namjene.
- U najgorem slučaju oni mogu obaviti posao prilično loše, proizvesti izlaz koji je jednostavno neprihvatljiv na ciljnom jeziku (tzv. jezična salata).
- Proces prevođenja uključuje brojna pravila koja su u interakciji na različite načine. To čini transformerske sustave teškima za razumjeti u praksi - što znači da ih je teško proširiti ili modificirati.
- Transformerski pristup je uistinu namijenjen za prevođenje u jednom smjeru, između jednog para jezika, on ne može poslužiti za razvoj pravih višejezičnih sustava.
Arhitektura
lingvističkog znanja
Kod transformerske arhitekture proces prevođenja oslanja se na određeno poznavanje
izvornog jezika i određeno znanje kako transformirati djelomično rastavljene izvorne rečenice u nizove koji nalikuju
rečenicama ciljnog jezika. Kod arhitekture stroja s lingvističkim znanjem, prevođenje se oslanja na prošireno poznavanje i
izvornog i ciljnog jezika i na vezu između rastavljenih rečenica na oba jezika. Arhitektura lingvističkog znanja
zahtijeva dvije stvari:
- pouzdanu gramatiku obaju jezika; ove gramatike koriste se kod rastavljanja rečenica svakog jezika u reprezentacije koje pokazuju njihovu strukturu, a koriste ih i generatori kako bi proizveli izlazne rečenice takvih reprezentacija
- dodatnu komparativnu gramatiku koja se koristi za povezivanje svake reprezentacije izvornog jezika s odgovarajućom reprezentacijom ciljnog jezika - reprezentacijom koja će tvoriti osnove za generiranje prijevoda na ciljni jezik.
Neke karakteristike strojeva s lingvističkim znanjem:
- Zato što sustav posjeduje djelomičnu gramatiku ciljnog jezika, izlaz će biti gramatički i stoga manje čudan i daleko manje gramatički ovisan o izvornom jeziku nego što je to kod transformerskih strojeva
- Zato što komparativna gramatika kompletno specificira vezu između reprezentacija dvaju jezika, kvaliteta prijevoda će biti veća nego kod transformerskih strojeva
- Zato što sustav nastoji razdvojiti jezik u razdvojene module (jedan gramatika za svaki jezik i jedna komparativna gramatika za svaki par jezika) u principu je vrlo jednostavno dodati novi jezik u sustav. Na primjer, dodavanje nizozemskog jezika u njemačko-engleski sustav zahtijevalo bi samo dodavanje modula nizozemske gramatike i jednog modula za nizozemsko-englesku komparativnu gramatiku i jednog za njemačko-englesku komparativnu gramatiku.
- Sustav će biti zbunjen neobičnim, teško prihvatljivim ili gotovo neprihvatljivim ulaznim rečenicama zato što posjeduje gramatiku izvornog jezika i zato je jako bitna gramatičnost.
- Budući da gramatika u ovim sustavima nije potpuna, neke gramatički komplicirane ulaze sustav neće moći prepoznati.
S gledišta proizvođača ovih strojeva, arhitektura transformerskih strojeva ima prednost zato jer prihvaća što god joj se da (kvaliteta prijevoda je onda naravno upitna). Arhitektura strojeva s lingvističkim znanjem ovdje kvalitetom zaostaje - zato što misli da zna nešto o tim jezicima, sklona je misliti da ono što ona ne prepoznaje nije jezik i stoga je neprihvatljivo.