Әдіс (Қазақ тілі)
Жобаны жүзеге асыру әдісі
Жоба бірнеше кезеңнен тұрады:
- Тілдік топтарды қалыптастыру.
- Әліпбиді таңдау (35 әріпті Ортатил стандартын қолдана отырып).
- Грамматика ережелерін таңдау (8-лік үндестік).
- Сөздерді таңдау (Орташа түсініктілік индексі).
- Әр тілден бір кітапты Ортатилге аудару.
Әліпби дипломатиялық архиконсонанттарды (тарихи бастапқы дауыссыздарды) қамтитын 35 әріптен тұрады:
| A a | Ä ä | B b | Ḅ ḅ |
| C c | Ç ç | D d | Ḍ ḍ |
| E e | F f | G g | Ğ ğ |
| H h | I ı | İ i | J j |
| K k | Ḳ ḳ | L l | M m |
| N n | Ñ ñ | O o | Ö ö |
| P p | Q q | R r | S s |
| Ş ş | T t | U u | Ü ü |
| W w | Y y | Z z |
Фонетика және айтылым ерекшеліктерін сақтау (Дипломатиялық бастапқы нүктелер)
Диалектілік айырмашылықтарды жою үшін, біз тарихи дыбыстық ауысуларды белгілеу мақсатында архиконсонанттарды тек сөз түбірінің бірінші әрпінде ғана қолданамыз:
- Ḳelmäk — оғыздар Gelmäk, қарлұқ/қыпшақ тілдерінде сөйлейтіндер Kelmäk деп оқиды.
- Ḍurmaq — оғыздар Durmaq, қарлұқ/қыпшақ тілдерінде сөйлейтіндер Turmaq деп оқиды.
- Qardaş — түріктер Kardaş, әзербайжандар Gardaş, шығыс топтар Qardaş деп оқиды.
- Ḅar — оғыздар Var, шығыс топтар Bar деп оқиды.
- Jol — оғыздар/қарлұқтар Yol, қыпшақтар Jol деп оқиды.
- Wätän — оғыздар Vätän, шығыс топтар Wätän деп оқиды.
Таңдау әдісі (Орташа түсініктілік индексі)
Сөз түбірлерін қабылдау туралы шешім ОТИ (Орташа түсініктілік индексі) негізінде беріледі.
ОТИ үш негізгі тіл тармағына бөлінген он түркі тіліндегі сөздерді бағалайды:
- Оғыз: Түрік, Әзербайжан, Түрікмен (3 тіл)
- Қарлұқ: Өзбек, Ұйғыр (2 тіл)
- Қыпшақ: Қазақ, Қырғыз, Қарақалпақ, Татар, Башқұрт (5 тіл)
Базалық балл әр тілде сөз нұсқасының бар (✅ = 1) немесе жоқ (❌ = 0) екенін анықтау, әр тармақ үшін орташа нәтижелерді есептеу және оларды қосу арқылы алынады.
Содан кейін қосымша Тармақаралық қамту бонусы қолданылады:
- "Барлығында бар" бонусы (+1.0): Егер бір нұсқа үш тармақтың әрқайсысында кем дегенде бір тілде болса.
- "Оғыз/Қыпшақ" бонусы (+0.5): Егер бір нұсқа Оғыз және Қыпшақ топтарын қамтып, Қарлұқ тобында болмаса.
ОТИ = Оғыз қосындысы + Қарлұқ қосындысы + Қыпшақ қосындысы + Қамту бонусы
ОТИ таңдау шектері
- ОТИ >= 2.3: Жоғары түсініктілік жеңімпазы. Автоматты түрде қабылданады және тікелей сөздікке енгізіледі.
- ОТИ < 2.3: Төмен түсініктілік нұсқасы. Ішкі мәліметтер базасында сақталады, бірақ бұл мағына үшін басқа жоғары балл алған нұсқалар болмаса ғана қолданылады.
Шынайы мысал: "Жел" түсінігі
Төменде қорытынды сөздерді анықтау үшін jel, şamal және daıl сөздерінің бағалау матрицасы көрсетілген.
Түсініктілікті бағалау матрицасы
| Метрика / Тіл | jel | şamal | daıl |
|---|---|---|---|
| Түрік | ✅ | ❌ | ❌ |
| Әзербайжан | ✅ | ❌ | ❌ |
| Түрікмен | ✅ | ✅ | ❌ |
| Өзбек | ✅ | ✅ | ❌ |
| Ұйғыр | ✅ | ✅ | ❌ |
| Қазақ | ✅ | ❌ | ✅ |
| Қырғыз | ✅ | ✅ | ❌ |
| Қарақалпақ | ✅ | ✅ | ❌ |
| Татар | ✅ | ❌ | ✅ |
| Башқұрт | ✅ | ❌ | ✅ |
| Оғыз қосындысы | 1.00 (3/3) | 0.33 (1/3) | 0.00 (0/3) |
| Қарлұқ қосындысы | 1.00 (2/2) | 1.00 (2/2) | 0.00 (0/2) |
| Қыпшақ қосындысы | 1.00 (5/5) | 0.40 (2/5) | 0.60 (3/5) |
| Барлығында бар (Бонус) | ✅ (+1.0) | ✅ (+1.0) | ❌ (+0.0) |
| Қорытынды ОТИ балы | 4.00 | 2.73 | 0.60 |
Қорытынды талдау және нәтижелер
- jel (ОТИ: 4.00): Бұл түбір он тілдің барлығында толық қамтылады (1.00 + 1.00 + 1.00) және толық отбасылық қамту үшін +1.0 бонус алады. Бірінші таңдау ретінде бірден қабылданады.
- şamal (ОТИ: 2.73): Кейбір тілдерде жоқ болғанына қарамастан, үш тармақты да сәтті қамтиды және +1.0 қамту бонусын алады (0.33 + 1.00 + 0.40 + 1.0). Балл 2.3-тен жоғары болғандықтан, şamal да jel-мен бірге сенімді түрде қабылданады.
- daıl (ОТИ: 0.60): Бұл нұсқа тек Қыпшақ тармағының бір бөлігінде ғана бар (0.60). Ол тармақаралық қамтуды қамтамасыз ете алмайды, бонус алмайды және 2.3 шегінен әлдеқайда төмен қалады. Жеңімпаз сөздер тізімінен шығарылады.
Қорытынды: jel және şamal сөздерінің екеуі де "Жел" түсінігін білдіретін ресми Ортатил нұсқалары ретінде даусыз қабылданады.