Монгол Улсын Ерөнхийлөгчийн дэргэдэх

ХЭЛНИЙ БОДЛОГЫН ҮНДЭСНИЙ ЗӨВЛӨЛ

Д.МООНДОЙ: МОНГОЛ ХҮНИЙ ЯРИАГ БИЧВЭР БОЛГОДОГ ЭНЭ СИСТЕМИЙГ АВЪЯ ГЭЭД ХЭЗЭЭ МӨДГҮЙ “ТОШИБА”, “САМСУНГ” ХААЛГА ТОГШИНО

Мэдээллийн технологийн инженер Д.Моондой гуайн санал болгосноор микрофонтой чихэвч зүүгээд сонины нэг мэдээг уншиж, бичвэрболгож үзлээ. “Нөхөр” систем миний хэлснийг үг үсэггүй буулгана лээ. Яг үнэндээ би хүний яриаг бичвэр болгон буулгадаг программ мөрөөдөгчийн нэг. “Гүүгл”-ээс гаргасан хэд хэдэн аппликэйшн ийм боломж бүрдүүлдэг ч монгол хэлийг бүрэн хөрвүүлж чаддаггүй. Ойр зуур команд төдий л ажилладаг. Саяхан “танилцсан” Gboard ч бас тиймэрхүү. Нэг өгүүлбэрийг бичвэр болгож дөнгөх ч нэлээн засвар шаардлагатай санагдсан.Тэгвэл Д.Моондой болон түүний нөхдийн хийж буй энэ систем өргөн хэрэглээний яриаг 93 хувьтай буулгаж байна. Энэ бол том амжилт. Дэлхий дахинаа ийм системийг 65-аас дээш хувийн магадлалтай бол ашиглаж болно гэж үздэг. Сан бүрдүүлэх ажил дуусаагүй ч энэ системийн ачаар бид ирээдүйтэй хөл нийлүүлж, ухаалаг төхөөрөмжүүдээ дуу хоолойгоороо удирдаж чадна.
Манай эрдэмтэд энэ ажлыг хэн нэгнээс мөнгө авч, төсөл хөтөлбөр хэрэгжүүлж эсвэл албан газарт харьяалагдан цалин авч хийгээгүй. Хэзээ нэг өдөр хэрэгтэй болно гэдгийг мэддэг учраас 30 гаруй жилийн өмнөөс анхаарлаа хандуулж, олон ажлыг амжуулж, өнөөгийн амжилтад хүрсэн байна. Д.Моондой гуайн яриаг хүргэе.

-Энэ системийг бид хэзээнээс хэрэглэж эхлэх вэ?

-Хүний ярианд жин, хэмжээ байхгүй. Зөвхөн спектр л гардаг. Тэр спектрийг бусад дуу чимээ буюу машин сигналдах, шувуу жиргэхээс салгаж таних нь энэ системийн үүрэг. Өргөн хэрэглээний идэвхтэй үгнээс гадна оноосон нэр хэлсэн ч таних учиртай. Үүнийг таниулахын тулд хоёр төрлийн сан бүрдүүлнэ.Компьютерт өгөгдлийн сан гэж байгаа шиг энэ системд яриа болон бичвэрийнхоёр төрлийн сан хэрэгтэй. Оруулсан бичвэрээхоолойгоор уншуулна. Цэг таслалгүйгээр тэр нь зөрүүгүй таарч байх ёстой. Ардын уран зохиолч Б.Лхагвасүрэн гуайн хэлснээр монгол хэл гурван сая үгтэй. Тэгээд тасралтгүй баяжиж байдаг. Эдүгээ бидний ярианд “коронавирус”, “вирус”, “корона” гэсэн үг хүч түрэн орж ирлээ. Ингээд нэг үг нэмэгдэхэд л түүнийг таних шаардлага тулгарна. Дээрээс нь монгол хэлний нэг үг 1300 янзаар хэлэгддэг. Хүүхэд, хөгшид, эрэгтэй, эмэгтэй хүн, дультраа, хэлгий, шүдгүй зэргээс шалтгаалахаас гадна аялга нь янз бүр байна. Буриад, дөрвөд, халх, урианхай хүн өөр өөрөөр хэлнэ. Бас үг бүр тийн ялгалаар хувирна. Ор гэдэг оноосон нэр байлаа гэхэд үүнийг “ор ор” гээд арай өндөр дуугаар хэлэхэд л орох гэдэг үйл үг болж байгаа. Систем үүнийг ч таних учиртай. Энэ бол магадлалын онол. Тэгэхээр 100 хувь дуусдаггүй ажил.

Яг одоо байгаа идэвхтэй үгсийг 90 гаруй хувьтай таньж байгаа нь л барьцтай харуулах амжилт.Цаашдаа уран зохиолын бүх ном, ойрын 10 жилийн турш нийтийн хэвлэлд гарсан мэдээг оруулах хэрэгтэй. Засагт хааны “Цахиур Төмөр” гээд оноосон нэр гараад ирлээ гэж бодоход эдгээр оноосон нэрсийг таниулахын тулд газар нутаг болон хүний нэртэй толь бичиг байвал бүгдийг нь таниулах нь. Хүний нэр гэхэд л 18 мянга орчим бий. Болгар улс гэхэд ийм системээ ажиллуулахын тулд 1945-2009 онд гарсан бүх хэвлэлийн мэдээ, сурвалжилга, нийтлэлийг оруулсан байна. Исланд 200-гаад романыг оруулжээ. Уран зохиолын ном оруулснаар өгүүлбэрзүйн зөв бүтэцтэй бичвэр орж танигддаг. Энгийн ярианд ийм зөв бүтэц бараг байдаггүй. Угаас хүн ярианыхаа 40 орчим хувийг үйлдлээрээ ойлгуулдаг гэж үздэг. Хүүхэд рүүгээ хараад “ном, ном, ном...” гэж хэлэхдээ энэ үгийг дагасан үйлдлээрээ “ном унших хэрэгтэй” гэдгийг ойлгуулчихдаг. Аль нэгэн уран зохиолын номонд ийм харилцан яриабайх магадлалтай тул оруулдаг. Ингэж бичвэрийн сан бүрдэнэ. Энэ бүрдүүлсэн санг бүгдийг нь нөгөө мянга гаруй янзаараа бас уншуулна. “Хавар болж цас хайлжээ” гэдгийг эрэгтэй, эмэгтэй, хөгшин залуу, хэлгий, шүдгүй, халх, буриадаараа уншуулна. Энэ мэтчилэнгээр ярианы сан бүрдүүлдэг.


-Та бүхэн энэ ажлаа 30 гаруй жил хийж байгаа гэв үү?

-Хэзээ хэрэглэж эхлэхийг нь яг таг хэлэхгүй ч 1985, 1986 оноос л хойш бичвэрийг яриа болгох, яриаг бичвэрболгох ажил эхэлсэн гэж хэлж болно. “Text to speech, speech to text” гэж хэлдэг шүү дээ. 2005 он гэхэд хэрэглээний түвшинд нэлээд ойртуулсан. Гэхдээ түүнээс хойш хийсэн ажил нь өмнөхөөсөө хэд дахин илүү мөртлөө системийн хувьд нэг хоёр хувиар л ахиулсан үйлдэл. Үүнийг ганц хүний нас гүйцэх юм биш. Энэ чухал ажлыг гүйцэлдүүлэхэд хэлний шинжлэлийн эрдэмтдийн маань оролцоо ч маш чухал үүрэгтэй.Зарим оронд энэ ажлыг “Зуун жилийн төсөл” гэж нэрлэсэн нь ч бий.
Хүний яриаг ийм аргаар таньж болох нь гэдэг таамаглал дэвшүүлж математик загварчлал гаргасан байдаг. Үүнийг Hide in Markov model буюу Марковын загвар гэдэг. 1920-иод оноос хойш хүний яриаг таньдаг болох тухай ярьж эхэлсэн. Гэвч эхэндээ ганц үсэг, тоо таньдаг байхаас хэтрээгүй. Ийнхүү таньдаг төхөөрөмжийг “Шидэт хайрцаг” гэж нэрлэсэн байдаг.

Өнөөдөр дэлхийн шинжлэх ухаан техник, мэдээллийн технологийн хөгжилд “ухаалаг компьютер, хиймэл оюун санаа” гэх мэт чиглэлээр асар их судалгаа хийгдэж түүний хэрэглээ төрийн болон бизнесийн олон салбарт нэвтрэн өссөөр байна. Хүний яриаг бичвэрболгох, түүнийгээ хүний хиймэл яриа болгодог программ хангамжийг хөгжүүлэх замаар энэ ухаалаг компьютер, хиймэл оюун санааг бий болгож байгаа билээ.
-

Хиймэл оюун ухаан, робот хөтлөгч, жолоочгүй машин гээд л технологийн дэвшлүүдтэй холбогдох энэ системийн хэрэглээний талаар илүү тодруулж ярьж өгнө үү?
 

-Гэр ахуйн цахилгаан хэрэгсэл, усны цоргонээгдэж хаагдах, тоос сорогч, телевизор асаах унтраахаас эхлээд бүх зүйл л энэ системийн тусламжтай ажиллана. Жишээ нь, “Шарп” компани хэл яриагаар удирдагддаг ухаалаг хөргөгчөө зарахын тулд монгол хүний яриаг таньдаг программ хангамжийн системийг суулгасан байх шаардлагатай болно. Тэгээд биднээс үүнийгээ өгөөч гэхэд нь гар хоосон байж болохгүй шүү дээ. Цаашдаа хүний яриа ойлгодог автомашиндаа очих хаягаа хэлчхээд гар утсаараа тоглоод явж байж болох нь. Зорьсон газарт чинь хүрчхээд машин танд бас хүний хэлээр хариулах нь. Үйлдвэрлэгчид тухайн машинаа аль улсад худалдахаас хамаарч тэр улс үндэстний яриаг таньдаг системээр хангагдсан байх хэрэгтэй болно.Банкны үйлчилгээний систем, нууцлал, бүр цаашлаад яриан захидал, мессеж, имэйл, хэвлэл мэдээлэл, утга зохиолын салбар, төрийн үйлчилгээ гээд хэрэглэхгүй салбар байхгүй дээ. Шүүхийн таслан шийдэх мэтгэлцээний үйл ажиллагаа, парламентын хэлэлцүүлэг, хүүхдэд хичээл заах зэрэг үйлдлийн анхны эх үүсвэр нь хүний яриа байдаг. Ялангуяа өдөр тутмын шүүхийн үйл ажиллагаа нь мэтгэлцээнд оролцогчдын харьцаа нь яриа байдаг бөгөөд түүнийг бичгийн текст болгон хадгалахад эдүгээ их хугацаа шаардаж байгаа. Хөдөлмөр цаг хугацаа хэмнэсэн энэ систем нь нөгөө сайн засаглалыг хэрэгжүүлэх, ил тод байдлыг хангах, төрийн шийдвэрийн шуурхай байдалд ч нөлөөлнө. Европын холбоо ч гэсэн ийм чиглэлээр буюу парламентын хуралдаандаа энэ системийг ашиглаж байна. Ялангуяа, Чех, Словак, Герман, Балтын орнууд энэ чиглэлийн судалгаа, шинжилгээний ажилд их хөрөнгө мөнгө зарж байна. Хөгжлийн бэрхшээлтэй иргэдийн хэрэглээ, хэлний хөгжил, эрүүл мэнд, батлан хамгаалахын салбарт ч энэ систем хэрэгтэй.Хүүхэд тоглоомтойгоо ярьж, дуртай үлгэрээ командаар сонгож, хайлт хийж болох нь байна шүү дээ.

Одоо танай багт хэдэн хүн харьяалагддаг вэ. Та бүхнийг судалгааны ажил л хийж байгаа, үүний цаана бизнес болгох гэсэн эсвэл төсөл хэрэгжүүлсэн, аливаа нэгэн компанийн захиалгаар ийм ажил хийгээгүй гэж ойлгож байна. Зөв үү?

-Бид онолын асуудлыг нь шийдэж байна. Компьютерийн чиглэлийн хүмүүс л ажиллаж байгаа. Цаашдаа ажлаа илүү өргөжүүлэхийн тулд хүн хүч, техник, хөрөнгө оруулалт хэрэгтэй. Мөн бодлогын түвшинд Ерөнхийлөгчийн дэргэдэх Хэлний Бодлогын үндэсний зөвлөл маань ч хамтран ажиллаж байна. Энэ бол эрдэмтэн судлаачид бидний хамтран бүтээх ёстой том ажил байгаа юм.Хэчнээн мундаг системийн инеженер англи, америк хүн байлаа гээд тэр хүн монгол хэлний бүтэц зохион байгуулалтыг ойлгож ажиллахгүй. Тэгэхээр үүнийг монгол хүн, монгол эрдэмтэн,судлаачид маань л хийнэ.
“Гүүгл” компаниар жишээлэхэд англи хэлний гурван тэрбум үгийн баазтай. Тэгэхээр бид бааз буюу өгөгдлийн сангаа хангалттай баяжуулах хэрэгтэй. Одоогийн байдлаар хүнд нэг сонирхоод хийдэг ажил байдаг даа. Тийм зарчмаар явж байна. Социализмын үед биднийг төрийн бодлогоор европт сургаж, энэ мэргэжлийг эзэмшүүлжээ. 1970-аад оны сүүлчээр ШУА-д лаборатори байгуулаад ийм залуусыг ажиллуулсан.
Одоо хийж байгаа энэ ажлыг гол зангиддаг хүн нь доктор Д.Сахиа. Словакийн ШУА-д 1988 оноос хойш ажиллаж байгаа хүн. Тэдний хүрээлэн европын холбооны хэл яриаг таних системийг судлан ажилладаг. Тэгэхээр бид энэ бааз суурь дээр түшиглэн ажлаа явуулж байгаа. Монголд үүнийг хийх лаборатори ч алга. Энэ программыг суулгаад бичих хүчин чадалтай компьютер ч алга. Өөр 20-иод хүн бий. Нэрлэх гээд хэн нэгнийг нь гээвэл гомдоохын нэмэр. Бидний үр хүүхэд ч ажиллаж байгаа. Энэ зүйл Монгол Улсад хэрэгтэй юм. Нэг хэсэг нь ч гэсэн улсдаа хэрэгтэй зүйл хийе гэж зорьж байна.
Коронавирус гээд зүйл ороод ирвэл элгээрээ хэвтэх нь гэдгээ яг өнөөдөр хэн хүнгүй л мэдэж байгаа шүү дээ. Угтаа бол ийм зүйл гарч магадгүй гээд урьдчилаад вируслогичдыг сургаад бэлтгэлтэй байх хэрэгтэй байсан шүү дээ. Түүнээс биш урдаас дөрвөн оношлуур ирнэ, тэндээс төд ирнэ гээд хоёр гараа өргөөд сууж баймааргүй л байна. Яг ийм байдлаараа цаашдаа амьдраад “Тоёота”, “Шарп”, “Сони” хэзээ мөдгүй л хаалга тогшоод яриа таньдаг системээ өг гэхэд нь бид “байхгүй ээ” гээд сууж болохгүй биз дээ. Дэлхийн хөгжлөөс хоцорно.
-Энэ ажлыг дэмжээд, хөрөнгө мөнгө зарцуулъя, босгоод бий болгоё гээд дэмжих эрх мэдэлтэн байх юм уу?
-Хүн болгон л дэмждэг. Гэхдээ яг бодит ажил болгоогүй л байна. Сонгууль ойртоод нэр дэвшигчид хоорондоо мэтгэлцэж, хийх ажлаараа өрсөлдөж байгаа үед уг нь ийм зүйлийг барьж аваад яримаар л байна шүү дээ. Хаана байгаа нь үл мэдэгдэх манан будан ярьж маргаж байхаар бодитой, ирээдүйд хэрэгтэй зүйлийг дэмжих санаачилга гаргадаг бол тустай. Европын холбооны ихэнх орон ийм системийг парламентын хэлэлцүүлэгтээ хэрэглэж байгаа гэж дээр хэлсэн шүү дээ. Гэтэл манайх жаран жилийн өмнөх бахь байдгаараа.
Зарим улс орон энэ системээ хөгжүүлэхийн тулд бодлогоор дэмжээд хэвлэл мэдээллийн байгууллагын аудио болон видео мэдээг эх бичвэртэйгээ ижил байх шаардлагыг хуульчлаад дата бааз үүсгэчихсэн байдаг. Түүнээс нь ийм систем хийж байгаа хүмүүс авч ашиглах боломжтой.
Хуулийн байгууллагад ашиглая гэвэл монголын 500 хуулийн ядаж 300-г текстээр оруулаад, 50 дөрвөд, 30 казах, 20 үзэмчин, 100 халх хүнээр уншуулчих хэрэгтэй байгаа юм. Тэр дундаа эмэгтэй, эрэгтэй, хүүхдээр мөн уншуулна шүү дээ.
-Ашиглаад эхэлбэл эдийн засаг, капиталын ач холбогдол их байх аа?
-Үнэлгээ алга л даа. Эдийн засаг фантазалдагхүмүүс үүнийг хийх байх. Бид мөнгө олох талаас нь биш шинжлэх ухааны талаас нь хийж байна. Хүний яриаг таньж текст болгодог технологийг үүрэн холбоонд хэрэглээ болгож нэвтрүүлснээр тэдний орлого 40 хувь өссөн тухай европын холбооны операторууд мэдээлдэг. Нөгөө нэг том хэрэглээ нь бүх төрлийн лавлах үйлчилгээнүүд (call center) хүний оролцоогүй болж автомат систем болно. Бага ангийн хүүхэд ч гэрийн даалгавар, шинэ хичээлээ үүгээр хийнэ.
-Технологийн эринд төрөлх хэлээ авч үлдэх бас нэг арга зам ч юм уу?
-Жижиг улс үндэстэн тусгаар тогтнолоо авч үлдэхийн тулд соёлын өвөө хадгалах ёстой. Монгол үндэсний хамгийн гол зүйл нь хэл. Үүнийг олон янзаар хийгээд үлдээх нь монгол хэлний дархлаа бий болгож байгаа юм.
-Та өдий хүртэл хийсэн ажлаасаа юу юугаар нь хамгийн их бахархдаг вэ?
-Бид 1980-аад онд Монголд компьютерийг таниулж хэрэглээ болголоо. Анхны “Монел” зурагт, компьютерийг хийлээ. Анх төлөвлөгөөний комисс дээр компьютерийн тухай танилцуулга хийхэд “Миний энэ цахилгаан тооны машин тэдэн оронтой тоо бодно” гэх зэргээр л өөдөөс ярьж байлаа. Компьютерийг бичгийн машин, тооны машинтай л жишиж байсан хэрэг. Тэгэхэд өнөөдөр Монголд компьютерийн хэрэглэгч 300 мянга, гар утастайгаа нийлбэл хоёр сая гаруй болох нь байна.
Хоёр дахь нь интернэт байна. “Миком” компанийг байгуулж, Монголын ард түмэнд интернэтийг танилцуулж, хэрэглүүлсэн. “Миком”-ыг байгуулах гээд лиценз авахаар хоёр жил хөөцөлдсөн. Тэгэхэд Дэд бүтцийн яамны нэг том дарга “Наад яриад байгаа юмыг чинь танаас өөр хүн хэрэглэх юм уу” гэж асууж л байлаа. Жилийн дараа тэр хүн сонгуулийн өмнөхөн өгсөн ярилцлагадаа “Зав л гарвал интернэтээр аялах юм” гэж ярьсан байсан даа. “Датаком” анх хэрэглэгчийн шугамаар интернэт оруулаад ирсэн байсан ч өндөр үнэтэй байлаа. Бид тэр үнийг 10 доллар болтол нь бууруулсан. Браузер веб хуудас үзэх боломжийг бий болгосон. Тэр үед шар хэвлэл гэж байлаа. Төр засаг шар хэвлэлтэйгээ дайтаж байсан ч гэж хэлж болно. Тухайн үед шар хэвлэл удахгүй үгүй болно оо, компьютерийн дэлгэцнээсээ бүгдийг уншина гэхэд бас л итгэх хүн цөөн байлаа. Анх интернэтийн хэрэглэгч олох гэж бид зовдог байсан. Овоо дориун боловсролтой, юм үзэж харсан танилыгаа компьютер авхуулаад утасны шугамаар интернэт холбоод өгтөл утсаар залгаад “Чиний энэ нөгөө юмны чинь нэг товчлуурыг дартал цай тавьдаг тавиур гараад ирлээ, хөгшин нь кофегоо тавьчих уу” гэж асууж байсан. Тэр нь сиди драйвер. Ингэж л монголчууд компьютертэй танилцаж байлаа. Дараа нь хэлэх зүйл бол 318 сумыг хамарсан шилэн кабелийн сүлжээ байгуулсан ажил. Хөдөөний сумын нэг нөхөр “Оройхон аймаг гарлаа, ийм дугаараар холбогдоорой” гээд зараа тавьчхаад сууж байна аа даа, одоо. Бий болгосон мань мэтээсээ илүүгээр л тэд хэрэглэж байна шүү дээ.
-“Монел”-ийг бий болгосон түүх ч бас бахархал юм аа?
-Анхны Монел компьютерийг 1986 онд хийж үзүүлсэн чинь Төр засгаас фирм байгуулсан. Тухайн үед Монгол экспорт, Импорт гэдэг хоёр компани бүх гадаад худалдааг хариуцаж, бусад нь түүгээр дамжиж байлаа. Тэгэхэд тэдэнтэй эн зэрэгцүүлж, гурав дахь нь болгож Монелийг байгуулсан. Өндөр ач холбогдол өгсөн байгаа биз дээ. Тэгж л хөрөнгөтөн оронд хөл тавьж, сургуульд ч сурч, сургалтад ч суусан. Өөрсдөө зөвхөн монополь байхыг хүсээгүй. “Эм Си Эс”, “Номин” гээд толгой компанийг байгуулсан залуус ч бас биднийг л дагаж, гаднын хөгжил дэвшилтэй хөл нийлүүлсэн.
-Та одоо хувьдаа компанитай юу. “Миком” болохоор улсынх байсан байх аа?
-Байхгүй ээ. Би тэтгэврийн хүн. Гурван жилийн өмнө тэтгэвэрт гарсан. Би нэг хэсэг хувьдаа гарч ажиллаж үзсэн л дээ. Болох л юм билээ. Жилийн сая долларын орлого олоод машин аваад л...
Таван давхар байшин барьж, тансаг машин унаад яах билээ. Хүний хэрэгцээ энгийн шүү дээ. Хоёр юм уу гурван өрөө байр, унах унаа байхад л болно. Хүн мөнх биш. Чадаж байгаа үедээ туг бариад давхиад байх биш чаддаг юмаа л хийе гэж бодсон. Олон хүнд хүртээлтэй, бахархах зүйлтэй байх нь сайхан биз дээ. Миний мэргэжлийн хувьд нэг суусан бол үүндээ бүх юмаа зориулдаг, уйгагүй, тасралтгүй үргэлжлүүлэх ажиллагаа шаардлагатай байдаг. Дунд нь нэг жүжигчин, дуучин, бизнесмен болно гээд гүйгээд байж болохгүй л дээ.

 “Юм мэдэхгүй хүмүүс гоё зүйл гэж ярихаас хэтэрдэггүй. Харин энэ мэргэжлийнхээ ачаар аливааг шинжлэх ухаанчаар харж, судалгаатай, нухацтай ханддаг болсон доо” гээд тэрбээр яриагаа өндөрлөлөө. Энэ удаа бид түүнтэй яриаг бичвэр болгон хөрвүүлдэг системийн тухай ярилцахаар урьсан учраас энэ хүргээд өндөрлөе.

Эх сурвалж: Atime.mn

 

Top