Show simple item record

dc.contributor.authorMcKellar, Cindy.en_US
dc.date.accessioned2012-10-23T13:21:40Z
dc.date.available2012-10-23T13:21:40Z
dc.date.issued2011en_US
dc.identifier.urihttp://hdl.handle.net/10394/7626
dc.descriptionThesis (M.A. (Applied Language and Literary Studies))--North-West University, Potchefstroom Campus, 2011.
dc.description.abstractDie sukses van enige masjienvertaalsisteem hang grootliks van die hoeveelheid en kwaliteit van die beskikbare afrigtingsdata af. n Sisteem wat met foutiewe of lae–kwaliteit data afgerig is, sal uiteraard swakker afvoer lewer as n sisteem wat met korrekte of hoë–kwaliteit data afgerig is. In die geval van hulpbronarm tale waar daar min data beskikbaar is en data dalk noodgedwonge vertaal moet word vir die skep van parallelle korpora wat as afrigtingsdata kan dien, is dit dus baie belangrik dat die data wat vir vertaling gekies word, so gekies word dat dit teksgedeeltes insluit wat die meeste waarde tot die masjienvertaalsisteem sal bydra. Dit is ook in so n geval uiters belangrik om die beskikbare data so goed moontlik aan te wend. Hierdie studie stel ondersoek in na metodes om afrigtingsdata te selekteer met die doel om n optimale masjienvertaalsisteem met beperkte hulpbronne af te rig. Daar word ook aandag gegee aan die moontlikheid om die gewigte van sekere gedeeltes van die afrigtingsdata te verhoog om sodoende die data wat die meeste waarde tot die masjienvertaalsisteem bydra te beklemtoon. Alhoewel hierdie studie spesifiek gerig is op metodes vir dataselektering en –manipulering vir die taalpaar Engels–Afrikaans, sou die metodes ook vir toepassing op ander taalpare gebruik kon word. Die evaluasieproses dui aan dat beide die dataselekteringsmetodes, asook die aanpassing van datagewigte, n positiewe impak op die kwaliteit van die resulterende masjienvertaalsisteem het. Die uiteindelike sisteem, afgerig deur n kombinasie van verskillende metodes, toon n 2.0001 styging in die NIST–telling en n 0.2039 styging in die BLEU–telling.en_US
dc.publisherNorth-West University
dc.subjectStatistiese masjienvertalingen_US
dc.subjectMasjienvertalingen_US
dc.subjectEngelsen_US
dc.subjectAfrikaansen_US
dc.subjectDataselekteringen_US
dc.subjectAfgrigtingsdataen_US
dc.subjectStatistical machine translationen_US
dc.subjectMachine translationen_US
dc.subjectEnglishen_US
dc.subjectData selectionen_US
dc.subjectTraining dataen_US
dc.titleDataselektering en –manipulering vir statistiese Engels–Afrikaanse masjienvertalingafr
dc.typeThesisen_US
dc.description.thesistypeMastersen_US


Files in this item

Thumbnail

This item appears in the following Collection(s)

  • ETD@PUK [6405]
    This collection contains the original digitized versions of research conducted at the North-West University (Potchefstroom Campus)

Show simple item record