xChar

譯注

原文鏈接為: 『Language Recognition Chart - Wikipedia』;
該譯本使用截至東八區時間2025/2/15晚8時最新版本製作;
並繼承自原作: 「 CC BY 4.0 國際」 授權協議進行共享;

總體上基於AI翻譯, 在力所能及的範圍内作了排版,校隊與增訂等工作, 譯名按照中國大陸習慣;

爲什麽不投中維? 好問題, 獎勵你IP豁免權()


語言識別圖表提供了多種可用於識別文本所使用語言的線索。

字符 Characters Alphabet

外語文本的語言通常可通過識別特定字符來判斷。

  • ABCDEFGHIJKLMNOPQRSTUVWXYZ(拉丁字母)

    • 且無其他字符——英語、印尼語、拉丁語、馬來語、斯瓦希里語、祖魯語

    • àäèéëïijöü——荷蘭語(除連字 ij/IJ 外,這些字母在荷蘭語中極少出現。即使較長的荷蘭語文本也常無附加符號)

    • áêéèëïíîôóúû——南非荷蘭語

    • êôúû——西弗里斯蘭語

    • ÆØÅæøå——丹麥語、挪威語

    • 單一附加符號,主要為變音符

      • ÄÖäö——芬蘭語(BCDFGQWXZÅbcfgqwxzå僅見於專有名詞和外來詞,偶見ŠšŽž)
      • ÅÄÖåäö——瑞典語(偶見é)
      • ÄÖÕÜäöõü——愛沙尼亞語(BCDFGQWXYZcfqwxyz僅見於專有名詞和外來詞,偶見ŠšŽž)
      • ÄÖÜẞäöüß——德語
    • 揚抑符

      • ÇÊÎŞÛçêîşû——庫爾德語
      • ĂÂÎȘȚăâîșț——羅馬尼亞語
      • ÂÊÎÔÛŴŶÁÉÍÏâêîôûŵŷáéíï——威爾士語(ÓÚẂÝÀÈÌÒÙẀỲÄËÖÜẄŸóúẃýàèìòùẁỳäëöüẅÿ亦存在但少見)
      • ĈĜĤĴŜŬĉĝĥĵŝŭ——世界語
    • 三種及以上附加符號類型

      • ÇĞİÖŞÜçğıöşü——土耳其語
      • ÁÐÉÍÓÚÝÞÆÖáðéíóúýþæö——冰島語
      • ÁÐÍÓÚÝÆØáðíóúýæø——法羅語
      • ÁÉÍÓÖŐÚÜŰáéíóöőúüű——匈牙利語
      • ÀÇÉÈÍÓÒÚÜÏàçéèíóòúüï·——加泰羅尼亞語
      • ÀÂÆÇÉÈÊËÎÏÔŒÙÛÜŸàâæçéèêëîïôœùûüÿ——法語(Ÿ和ÿ僅見於特定專有名詞)
      • ÁÀÇÉÈÍÓÒÚËÜÏáàçéèíóòúëüï(·僅用於加斯科涅方言)——奧克語
      • ÁÉÍÓÚÂÊÔÀãõçáéíóúâêôà(ü用於巴西葡萄牙語,k、w、y不用於本土詞)——葡萄牙語
    • ÁÉÍÑÓÚÜáéíñóúü ¡¿——西班牙語

    • ÀÉÈÌÒÙàéèìòù——意大利語

    • ÁÉÍÓÚÝÃẼĨÕŨỸÑG̃áéíóúýãẽĩõũỹñg̃——瓜拉尼語(唯一使用g̃的語言)

    • ÁĄĄ́ÉĘĘ́ÍĮĮ́ŁŃ áąą́éęę́íįį́łń(FQRVfqrv不用於本土詞)—— 南阿薩巴斯卡語系

      • ’ÓǪǪ́ āą̄ēę̄īį̄óōǫǫ́ǭúū——西阿帕奇語
      • 'ÓǪǪ́ óǫǫ́——納瓦霍語
      • ’ÚŲŲ́ úųų́——奇里卡瓦語/梅斯卡萊羅語
    • ąłńóż 列克提克語支

      • ąćęłńóśźż——波蘭語
      • ćśůź——西里西亞語
      • ãéëòôù——卡舒比語
    • A, Ą, Ã, B, C, D, E, É, Ë, F, G, H, I, J, K, L, Ł, M, N, Ń, O, Ò, Ó, Ô, P, R, S, T, U, Ù, W, Y, Z, Ż —— 卡舒比語字母

    • ČŠŽ

      • 且無其他字符——斯洛文尼亞語
      • ĆĐ——波斯尼亞語、克羅地亞語、塞爾維亞語(拉丁轉寫)
      • ÁĎÉĚÍŇÓŘŤÚŮÝáďéěíňóřťúůý——捷克語
      • ÁÄĎÉÍĽĹŇÓÔŔŤÚÝáäďéíľĺňóôŕťúý——斯洛伐克語
      • ĀĒĢĪĶĻŅŌŖŪāēģīķļņōŗū——拉脫維亞語(ŌŖ和ōŗ在現代拉脫維亞語中已停用)
      • ĄĘĖĮŲŪąęėįųū——立陶宛語
    • ĐÀẢÃÁẠĂẰẲẴẮẶÂẦẨẪẤẬÈẺẼÉẸÊỀỂỄẾỆÌỈĨÍỊÒỎÕÓỌÔỒỔỖỐỘƠỜỞỠỚỢÙỦŨÚỤƯỪỬỮỨỰỲỶỸÝỴ đàảãáạăằẳẵắặâầẩẫấậèẻẽéẹêềểễếệìỉĩíịòỏõóọồổỗốơờởỡớợùủũúụưừửữứựỳỷỹýỵ—— 越南語

      • ꞗĕŏŭo᷄ơ᷄u᷄——中古越南語
    • ā ē ī ō ū——可能見於日語羅馬字或轉寫文本,或夏威夷語、毛利語文本

    • é——巽他語

    • ñ——巴斯克語/西班牙語

    • ü ê ẑ ĉ ŝ ŋ —— 漢語拼音字母(後五個實際極爲少見)

  • أ ا ب ت ث ج ح خ د ذ ر ز س ش ص ض ط ظ ع غ ف ق ك ل م ن ه ؤ و ئ ى ي ء 阿拉伯字母

    • 阿拉伯語、馬來語(爪夷文)、庫爾德語(索拉尼方言)、旁遮普語、普什圖語、信德語、烏爾都語等
    • پ چ ژ گ——波斯語(法爾西語)
  • 婆羅米系文字

    • 孟加拉文
      • অ আ কা কি কী উ কু ঊ কূ ঋ কৃ এ কে ঐ কৈ ও কো ঔ কৌ ক্ কত্‍ কং কঃ কঁ ক খ গ ঘ ঙ চ ছ জ ঝ ঞ ট ঠ ড ঢ ণ ত থ দ ধ ন প ফ ব ভ ম য র ৰ ল ৱ শ ষ স হ য় ড় ঢ় ০ ১ ২ ৩ ৪ ৫ ৬ ৭ ৮ ৯
      • 用於孟加拉語、阿薩姆語
    • 天城文
      • अ आ इ ई उ ऊ ऋ ॠ ऌ ॡ ऍ ऎ ए ऐ ऑ ऒ ओ ओ क ख ग घ ङ च छ ज झ ञ ट ठ ड ढ ण त थ द ध न प फ ब भ म य र ल ळ व श ष स ह ० १ २ ३ ४ ५ ६ ७ ८ ९ प् पँ पं पः प़ पऽ
      • 用於梵語、印地語、邁蒂利語、馬加希語、馬拉地語、克什米爾語、信德語、比利語、孔卡尼語、博傑普爾語及尼泊爾的尼泊爾語
    • 古木基文
      • ਅਆਇਈਉਊਏਐਓਔਕਖਗਘਙਚਛਜਝਞਟਠਡਢਣਤਥਦਧਨਪਫਬਭਮਯਰਲਲ਼ਵਸ਼ਸਹ
      • 主要用於旁遮普語,以及布拉吉語、哈里波利語(及其他印度斯坦方言)、梵語、信德語
    • 古吉拉特文
      • અ આ ઇ ઈ ઉ ઊ ઋ ઌ ઍ એ ઐ ઑ ઓ ઔ ક ખ ગ ઘ ઙ ચ છ જ ઝ ઞ ટ ઠ ડ ઢ ણ ત થ દ ધ ન પ ફ બ ભ મ ય ર લ ળ વ શ ષ સ હ ૠ ૡૢૣ
      • 用於古吉拉特語、卡奇語
    • 藏文
      • ཀ ཁ ག ང ཅ ཆ ཇ ཉ ཏ ཐ ད ན པ ཕ བ མ ཙ ཚ ཛ ཝ ཞ ཟ འ ཡ ར ལ ཤ ས ཧ ཨ
      • 用於標準藏語、宗卡語(不丹語)、錫金語
  • АБВГДЕЖЗИКЛМНОПРСТУФХЦЧШ(西里爾字母)

    • ЙЩЬЮЯ
      • Ъ——保加利亞語
      • ЁЫЭ
        • Ў,無Щ,И替換為І(某些變體用Ґ)——白俄羅斯語
        • 罕見Ъ——俄語
      • ҐЄІЇ——烏克蘭語
    • ЉЊЏ,Ј替代Й(武克·卡拉季奇改革)
      • ЃЌЅ——馬其頓語
      • ЋЂ——塞爾維亞語
    • ЄꙂꙀЗІЇꙈОуꙊѠЩЪꙐЬѢЮꙖѤѦѨѪѬѮѰѲѴҀ——古教會斯拉夫語、教會斯拉夫語
    • Ӂ——德涅斯特河沿岸的羅馬尼亞語(其他地區用拉丁字母)
  • ΑΒΓΔΕΖΗΘΙΚΛΜΝΞΟΠΡΣΤΥΦΧΨΩ αβγδεζηθικλμνξοπρσςτυφχψω(希臘字母)——希臘語

  • אבגדהוזחטיכלמנסעפצקרשת(希伯來字母)

    • 可能帶有字母上下或內部的點線符號——希伯來語
    • פֿ;僅在א、י、ו下方帶點線符號——意第緒語
    • 無點線符號,多個詞以א結尾(即左側位置)——阿拉米語
    • 拉迪諾語
  • 漢字文化圈——部分東亞語言

    • 僅漢字——漢語
    • 帶平假名(あいうえおの)或片假名(アイウエオノ)——日語
  • 위키백과에(常見橢圓和圓形符號)——韓語

  • ㄅㄆㄇㄈㄉㄊㄋㄌㄍㄎㄏ等——注音符號

    • ㄪㄫㄬ——非普通話/僅方言使用

កខគឃងចឆជឈញដឋឌឍណតថទធនបផពភមសហយរលឡអវអ្កអ្ខអ្គអ្ឃអ្ងអ្ចអ្ឆអ្ឈអ្ញអ្ឌអ្ឋអ្ឌអ្ឃអ្ណអ្តអ្ថអ្ទអ្ធអ្នអ្បអ្ផអ្ពអ្ភអ្មអ្សអ្ហអ្យអ្រអ្យអ្លអ្អអ្វ អក្សរខ្មែរ(高棉字母)——高棉語

  • Ա Բ Գ Դ Ե Զ Է Ը Թ Ժ Ի Լ Խ Ծ Կ Հ Ձ Ղ Ճ Մ Յ Ն Շ Ո Չ Պ Ջ Ռ Ս Վ Տ Ր Ց Ւ Փ Ք Օ Ֆ(亞美尼亞字母)——亞美尼亞語

  • ა ბ გდ ევ ზ ჱ თ ი კ ლ მ ნ ჲ ო პ ჟ რ ს ტ ჳ უ ფ ქ ღ ყ შ ჩ ც ძ წ ჭ ხ ჴ ჯ ჰ ჵ ჶ ჷ ჸ(格魯吉亞字母)——格魯吉亞語

  • กขฃคฅฆงจฉชซฌญฎฏฐฑฒณดตถทธนบปผฝพฟภมยรฤลฦวศษสหฬอฮฯะา฿เแโใไๅๆ๏๐๑๒๓๔๕๖๗๘๙๚๛(泰文字)——泰語

  • AEIOUHKLMNPW'(夏威夷字母)——夏威夷語

  • ⴰⴱⴲⴳⴴⴵⴶⴷⴸⴹⴺⴻⴼⴽⴾⴿⵀⵁⵂⵃⵄⵅⵆⵇⵈⵉⵊⵋⵌⵍⵎⵐⵑⵒⵓⵔⵕⵖⵗⵘⵙⵚⵛⵜⵝⵞⵠⵡⵢⵣⵤⵥⵦⵧ(提非納文),用於塔馬塞特語(柏柏爾語)

  • ꦄꦅꦆꦇꦈꦉꦊꦋꦌꦍꦎꦏꦐꦑꦒꦓꦔꦕꦖꦗꦘꦙꦚꦛꦜꦝꦞꦟꦠꦡꦢꦣꦤꦥꦦꦧꦨꦩꦪꦫꦬꦭꦮꦯꦰꦱꦲ(爪哇字母),與阿拉伯字母和拉丁字母混用,近似巴厘字母

  • ᮃᮄᮅᮆᮇᮈᮉᮊᮋᮌᮍᮎᮏᮐᮑᮒᮓᮔᮕᮖᮗᮘᮙᮚᮛᮜᮝᮞᮟᮠ(巽他字母),與阿拉伯字母和拉丁字母混用

拉丁字母(含擴展)Latin

羅曼語族 Romance

含大量拉丁語詞根。

法語 French Français

  • 帶重音符號的字母:â ç è é ê î ô û,罕見 ë ïù 僅用於單詞 à 僅用於少數詞尾(包括 à)。從不使用 á í ì ó ò ú
  • 角引號:« »(“花體”引號亦常用);對話通常用破折號表示。
  • 常見短詞:la, le, les, un, une, des, de, du, à, au, et, ou, , sur, il, elle, ils, se, je, vous, que, qui, y, en, si, ne, est, sont, a, ont
  • 常見代詞和助詞的縮寫形式,如 l'd',較少見 c', j', m', n', s', t',或罕見 z' —— 僅用於以元音或某些情況下以 h 開頭的詞前。
  • 常見雙字母和三字母組合:
    • 元音雙字母:au, ai, ei, ou。詞尾 -ez
    • 元音雙字母(鼻音):an, en, in, on,罕見 un。這些組合中的 nb, pm 前變為 m(如 embouchure,從不寫作 enbouchure)。
    • 元音三字母:eau, ein, ain, oin
    • 輔音雙字母:ch, gu-。罕見 sh。半輔音 -ill-
  • 字母 wk 罕見,僅用於外來詞,多來自日耳曼語族(如 whisky)。
  • 連字 œæ 為傳統用法,但現已少用(少數詞仍常見,如 œil, œuf(s), bœuf(s),其他多為科學/技術詞彙,源自拉丁語)。
  • 詞尾為 -aux, -eux, 或 -oux

西班牙語 Spanish Español

  • 字符:¿ ¡(倒置問號和感嘆號),ñ
  • 所有元音(á, é, í, ó, ú)可帶尖音符
  • 字母 u 可帶分音符(ü),但僅在字母 g
  • 常用詞:de, el, del, los, la(s), uno(s), una(s), y
  • 無縮寫形式
  • 無重音符號
  • 字母 kw 罕見,僅用於外來詞(如 walkman
  • 詞首:ll-(注意區分威爾士語或加泰羅尼亞語)雙 L(ll)
  • 詞尾:-o, -a, -ción, -miento, -dad
  • 角引號:« »(“花體”引號亦常用);對話常用破折號表示

意大利語 Italian Italiano

  • 幾乎所有本土詞以元音結尾。例外包括 non, il, per, con, del
  • 常見單字母詞:è
  • 常見詞:perché
  • 字母組合:gli, gn, sci
  • 字母 j, k, w, xy 罕見,僅用於外來詞(如 whisky)。
  • 詞尾:-o, -a, -zione, -mento, -tà, -aggio
  • 重音符號(如 à)幾乎總出現在詞的最後一個字母。
  • 雙輔音(tt, zz, cc, ss, bb, pp, ll 等)常見。

加泰羅尼亞語 Catalan Català

  • 字符:à, è, é, í, ï, ò, ó, ú, ü, ç, ·
  • 字母組合 tz(巴斯克語亦常見)和 l·l
  • 音節和詞尾為 -aig, -eig, -oig, -uig, -aix, -eix, -oix, -uix
  • 字母組合:tx(巴斯克語亦常見)和 tg
  • 字母 y 僅用於組合 ny 和外來詞
  • 字母 kw 罕見,僅用於外來詞(如 walkman
  • 詞尾:-o, -a, -es, -ció, -tat, -ment
  • 詞首:ll-(西班牙語和威爾士語亦常見)
  • 常見詞:això, amb, mateix, tots, que

羅馬尼亞語 Romanian Română

  • 字符:ă â î ș ț
  • 常見詞:și, de, la, a, ai, ale, alor, cu
  • 詞尾:-a, -ă, -u, -ul, -ului, -ție(或 -țiune), -ment, -tate;姓氏以 -escu 結尾
  • 雙重和三重 i:copii, copiii
  • 注意:羅馬尼亞語在網絡上常無附加符號,增加識別難度。有時在 S (ş) 和 T (ţ) 上使用變音符號而非正確的逗號(上方)。

葡萄牙語 Portuguese Português

  • 字符:ã, õ, â, ê, ô, á, é, í, ó, ú, à, ç
  • 常見單字母詞:a, à, e, é, o
  • 常見雙字母詞:ao, as, às, da, de, do, em, os, ou, um
  • 常見三字母詞:aos, com, das, dos, ele, ela, mas, não, por, que, são, uma
  • 常見詞尾:-ção, -dade, -ismo, -mente
  • 常見雙字母組合:ch, nh, lh;例:chave, galinha, baralho。
  • 字母 k, w 和 y 罕見。主要用於外來詞,如:keynesianismo, walkie-talkie, nylon
  • 多數單數詞以元音、l、m、r 或 z 結尾。
  • 複數詞以 -s 結尾。

瓦隆語 Walloon Walon

  • 字符:å, é, è, ê, î, ô, û
  • 常見雙字母和三字母組合:ai, ae, én, -jh-, tch, oe, -nn-, -nnm-, xh, ou
  • 常見單字母詞:a, å, e, i, t', l', s', k'
  • 常見雙字母詞:al, ås, li, el, vs, ki, si, pô, pa, po, ni, èn, dj'
  • 常見三字母詞:dji, nén, rén, bén, pol, mel
  • 常見詞尾:-aedje, -mint, -xhmint, -ès, -ou, -owe, -yî, -åcion
  • 縮寫後接空格(最好為非斷行空格),如:l' ome 而非 l'ome

加利西亞語 Galician Galego

  • 與葡萄牙語相似;不定冠詞 "unha"(陰性複數),後綴 -ción 及字母 "x" 的頻繁使用通常標誌加利西亞語。
  • 定冠詞 o(陽性單數),os(陽性複數),a(陰性單數),as(陰性複數)
  • 常見雙字母組合:nh(ningunha)
  • 字母 j, k, w 和 y 不在字母表中,僅見於外來詞

日耳曼語族 Germanic

英語 English

  • 詞:a, an, and, in, of, on, the, that, to, is, what, II 指代自己時總大寫)
  • 字母組合:th, ch, sh, wh, ough, augh, qu
  • 詞尾:-ing, -tion, -ed, -age, -s, -’s, -’ve, -n’t, -’d
  • 絕大多數詞以輔音結尾,有時以 e 結尾。常見例外:who, to, so, no, do, a, 及少數名字如 Julia.
  • 附加符號僅用於外來詞(如 piñata)

荷蘭語 Dutch Nederlands

  • 字母組合 ij(大寫為 IJ,亦見於連字 IJij, 手寫中偶有ÿ的形式),ei, ou, au, oe, 雙元音(但非 ii),kw, ch, sch, oei, ooi, aaiuw(尤其 eeuw, ieuw, auw, 和 ouw)。
  • h, j, q, v, w, xz 外,所有輔音可雙寫。
  • 字母 c(除組合 (s)ch 外),q, xy 幾乎僅見於外來詞。
  • 詞:het, op, en, een, voor(及 voor 的複合詞)。
  • 詞尾:-tje, -sje, -ing, -en, -lijk,
  • 詞首:z-, v-, ge-
  • t/m 偶見於時間或數字間(如門牌號)。

西弗里斯蘭語 West Frisian Frysk

  • 字母組合:ij, ei, oa
  • 詞:yn

南非荷蘭語 Afrikaans

  • 詞:'n, as, vir, nie

  • 與荷蘭語相似,但:

    • 荷蘭語常見字母 cz 罕見,僅用於外來詞(如 chalet);
    • 荷蘭語常見元音 ij 不用;代之以 iy(如 -lik, sy);
    • 荷蘭語常見詞尾 -en 罕見,代之以 -e

德語 German Deutsch

  • 變音符號(ä, ö, ü),清S(ß)
  • 字母組合:ch, ck, sch, tsch, tz, ss,
  • 常見詞:der, die, das, den, dem, des, er, sie, es, ist, ich, du, aber
  • 常見詞尾:-en, -er, -ern, -st, -ung, -chen, -tät
  • 罕見字母:x, y(除外來詞外)
  • 字母 c 罕見,除上述組合及外來詞外
  • 長複合詞
  • 序數詞後接句點(.),如 3. Oktober
  • 句中多詞大寫,因德語所有名詞大寫。

瑞典語 Swedish Svenska

  • 字母 å, ä, ö,罕見 é
  • 常見詞:och, i, att, det, en, som, är, av, den, , om, inte, men
  • 常見詞尾:-ning, -lig, -isk, -ande, -ade, -era, -rna
  • 常見姓氏詞尾:-sson, -berg, -borg, -gren, -lund, -lind, -ström, -kvist/qvist/quist
  • 長複合詞
  • 字母組合:stj, sj, skj, tj, ck, än
  • 不使用字母 w, z,除外國專有名詞及部分外來詞外,但 x 使用,與丹麥語和挪威語不同,後者以 ks 替代
  • 輔音雙寫常見,但元音雙寫極罕見

丹麥語 Danish Dansk

  • 字母 æ, ø, å
  • 常見詞:af, og, til, er, på, med, det, den
  • 常見詞尾:-tion, -ing, -else, -hed
  • 長複合詞;
  • 不使用字母 q, w, xz,除外國專有名詞及部分外來詞外;
  • 區別於挪威語:使用字母組合 øj;頻繁使用 æ;外來詞拼寫保留(尤其使用 c),如 centralstation
  • 輔音雙寫常見(但詞尾不雙寫,與挪威語和瑞典語不同),元音雙寫極罕見
  • 1948年前正字法:aa 替代 å;所有名詞大寫

挪威語 Norwegian Norsk

  • 字母 æ, ø, å
  • 常見詞:av, ble, er, og, en, et, men, i, å, for, eller
  • 常見詞尾:-sjon, -ing, -else, -het
  • 長複合詞;
  • 不使用字母 c, w, zx,除外國專有名詞及部分外來詞外;
  • 兩種語言版本:書面挪威語Bokmål(更接近丹麥語)和 新挪威語Nynorsk —— 例如 ikke, lørdag, Norge(書面挪威語) vs. ikkje, laurdag, Noreg(新挪威語);新挪威語使用詞 òg;印刷材料幾乎總以書面挪威語出版;
  • 區別於丹麥語:使用字母組合 øy;較少使用 æ(主要但不限於 r 前);外來詞拼寫“挪威化”(尤其去除 c),如 sentralstasjon
  • 輔音雙寫常見(包括詞尾),元音雙寫極罕見

冰島語 Icelandic Íslenska

  • 字母 á, ð, é, í, ó, ú, ý, þ, æ, ö
  • 常見詞首:fj-, gj-, hj-, hl-, hr-, hv-, kj-, 和 sj-,
  • 常見詞尾:-ar(尤其 -nar),-ir(尤其 -nir),-ur, -nn(尤其 -inn
  • 不使用字母 c, q, w, 或 z,除外國專有名詞、部分外來詞及舊文本中的 z 外。
  • 輔音雙寫常見,元音雙寫極罕見

法羅語 Faroese Føroyskt

  • 字母 á, ð, í, ó, ú, ý, æ, ø
  • 字母組合:ggj, oy, skt
  • 區別於冰島語:不使用 é 或 þ,使用 ø 替代 ö(路標上偶見 ö,甚至 ő)。
  • 輔音雙寫常見,元音雙寫極罕見

波羅的語族 Baltic

拉脫維亞語 Latvian Latviešu

  • 使用附加符號:ā, č, ē, ģ, ī, ķ, ļ, ņ, ō, ŗ, š, ū, ž
  • 不使用字母 q, w, x, 或 y,除外國品牌名、國際符號、部分外來詞(如 queer)及舊文本中的 w 外。
  • 現代語言中不再使用 ō 或 ŗ
  • 元音雙寫極罕見
  • 輔音雙寫罕見
  • 序數詞後接句點(.),如 2005. gads
  • 常見詞:ir, bija, tika, es, viņš

立陶宛語 Lithuanian Lietuvių

  • 字母 ą, č, ę, ė, į, š, ų, ū, ų 視覺上豐富
  • 無字母 q, w, x
  • 元音和輔音雙寫極罕見
  • 同一詞多種形式(通常為詞尾),如 namas, namo, namus, namams 等
  • 一般詞較長(與日耳曼語族相比,無冠詞且介詞較少)
  • 常見詞:ir, yra, kad, bet

斯拉夫語族 Slavic

波蘭語 Polish Polski

  • 輔音組合 rz, sz, cz, prz, trz
  • 包含:ą, ę, ć, ś, ł, ń, ó, ż, ź
  • 詞:w, z, we, i, na(多個單字母詞)
  • 詞:jest, się
  • 詞首:był, będzie, jest(動詞 być 的變位形式,意為“是”)。

捷克語 Czech Čeština

  • 字母 ž š ů ě ř 視覺上豐富
  • 詞:je, v
  • 區別於斯洛伐克語:不使用 ä, ľ, ĺ, ŕ 或 ô;ú 僅出現在詞首。

斯洛伐克語 Slovak Slovenčina

  • 字母 ž š č 視覺上豐富;
  • 使用:ä, ľ, 和 ô,極少使用 ĺ 和 ŕ;
  • 典型後綴:-cia,
  • 區別於捷克語:不使用 ě, ř 或 ů。

克羅地亞語 Croatian Hrvatski

  • 與塞爾維亞語相似
  • 字母組合 dž, lj, nj
  • 無字母 q, w, x, y
  • 典型後綴:-ti, -ći
  • 特殊字母:č, ć, š, ž, đ
  • 常見詞:a, i, u, je
  • 區別於塞爾維亞語:常見序列 -ije--je-;動詞以 -irati, -iran 結尾

塞爾維亞語 Serbian Srpski/Српски

塞爾維亞語拉丁字母 Serbian Latin
  • 與克羅地亞語相似
  • 字母組合 dž, lj, nj(lj 和 nj 比 dž 更常見,但差異不大)
  • 無字母 q, w, x, y
  • 典型動詞後綴 -ti, -ći(不定式使用較克羅地亞語少)
  • 外來詞可能以 -tija, -ovan, -ovati, -uje 結尾
  • 特殊字母:đ(罕見),č, š(常見),ć, ž(較少見)
  • 常見詞:a, i, u, je, jeste
  • 未來時後綴 -iće, -ićeš, -ićemo, -ićete(克羅地亞語中無此形式)
  • 元音序列 -ije--je- 在波斯尼亞和黑塞哥維那、黑山及克羅地亞的塞爾維亞語中常見,但在塞爾維亞本土,這些序列被替換為 -e-(ekavica)。
塞爾維亞語西里爾字母 Serbian Cyrillic
  • 使用 Џ, Ј, Љ, Њ, Ђ, Ћ
  • 不使用 Щ, Ъ, Ы, Ь, Э, Ю, Я, Ё, Є, Ґ, Ї, І, Ў
  • 區別於馬其頓語:不使用 Ѕ, Ѓ, Ќ

凱爾特語族 Celtic

威爾士語 Welsh Cymraeg

  • 字母 Ŵ, ŵ 用於威爾士語
  • 詞:y, yr, yn, a, ac, i, o
  • 字母組合 wy, ch, dd, ff, ll, mh, ngh, nh, ph, rh, th, si
  • 不使用字母:k, q, v, x, z
  • 字母 j 僅用於外來詞
  • 常見帶重音符號的字母:â, ê, î, ô, û, ŵ, ŷ,雖然尖音符(´)、重音符(`)和分音符(¨)理論上可用於所有元音
  • 詞尾:-ion, -au, -wr, -wyr
  • y 是該語言中最常見的字母
  • 輔音間的 ww 在威爾士語中實際代表元音)
  • 揚抑符(^)是最常見的附加符號,但附加符號常被省略

愛爾蘭語 Irish Gaeilge

  • 帶尖音符的元音:á é í ó ú
  • 詞首字母組合 bp dt gc bhf
  • 字母組合 sc cht
  • 不使用字母 J, K, Q, V, W
  • 常見 bh, ch, dh, fh, gh, mh, th, sh
  • 區別於(蘇格蘭)蓋爾語:可能出現第二或第三字母大寫而非首字母大寫的詞或名字:hÉireann

蘇格蘭蓋爾語 Scottish Gaelic Gàidhlig

  • 帶重音符的元音:à è ì ò ùéó 仍偶見,但現已不鼓勵使用)
  • 字母組合 sg chd
  • 常見 bh, ch, dh, fh, gh, mh, th, sh
  • 區別於愛爾蘭語:前綴帶連字符,因此詞中通常無大寫字母:an t-Oban

阿爾巴尼亞語 Albanian Shqip

  • 獨特字母:ë, ç
  • ë 是該語言中最常見的字母。
  • 字母 w 僅用於外來詞。
  • dh, gj, ll, nj, rr, sh, th, xh, 和 zh 被視為單字母而非雙字母。
  • 常見詞:po, jo, dhe, i, të, me

馬耳他語 Maltese Malti

  • 獨特字母:ċ, ġ, ħ, għ, ħ, ż
  • 閃族起源,與阿拉伯語高度互通
  • 定冠詞使用 il-xxx

伊朗語族 Iranian

庫爾德語 Kurdish Kurdî/كوردی

  • 使用揚抑符(^):ê, î, û 和變音符(¸):ç, ş
  • xwe(自己、我自己、你自己等)頻繁出現且高度特定(xw 組合)
  • ( I, i ) 是該語言中最常見的字母
  • 使用八個元音(a, e, ê, i, î, o, u, û)
  • 無元音的詞不存在
  • 大量複合詞

芬蘭-烏戈爾語族 Finno-Ugric

芬蘭語 Finnish Suomi

  • 獨特字母 å, äö;但從不使用 õüy 替代 ü
  • b, f, z, šž 僅見於外來詞和專有名詞;後兩者在某些文本中被替換為 shzh
  • c, q, w, x, å 僅見於(通常為外國的)專有名詞
  • 外來詞外,d 僅出現在元音間或 hd
  • 外來詞外,g 僅出現在 ng
  • 外來詞外,詞不以雙輔音開頭;這反映在音節結構中,輔音組合僅出現在音節邊界,某些外來詞除外
  • 常見詞:sinä, on
  • 常見詞尾:-nen, -ka/-kä, -in, -t(複數後綴)
  • 常見元音組合:ai, uo, ei, ie, oi, , äi
  • 字母重複程度異常高,元音和輔音均可雙寫,如 aa, ee, ii, kk, ll, ss, yy, ää
  • 長詞頻繁

愛沙尼亞語 Estonian Eesti

  • 獨特字母:õ, ä, öü;但從不使用 ßå
  • 與芬蘭語相似,但:
    • 字母 y 不用,除外來詞(ü 為對應元音)
    • 字母 bg(無前置 n)在外來詞外亦存在
    • 偶見 šž,主要用於外來詞(及組合
    • 外來詞較芬蘭語更常見,主要源自德語
    • 詞以輔音結尾較芬蘭語更頻繁,詞尾 b, d, v 尤為典型
    • 字母 d 在愛沙尼亞語中較芬蘭語更常見,且常為詞尾(複數後綴),芬蘭語中從不如此
    • öö 較芬蘭語更常見;其他雙寫包括 õõ, üü,罕見 hh(表示德語 ch)甚至 šš
  • 常見詞:ja, on, ei, ta, see, või

匈牙利語 Hungarian Magyar

  • 字母 ő 和 ű(雙尖音符)為匈牙利語獨有
  • 帶重音符的字母 áé 頻繁
  • 字母組合:cs, dz, dzs, gy, ly, ny, sz, ty, zs(均視為單獨字母),leg‐, ‐obb(注意:sz 在波蘭語中亦常見)
  • 常見詞:a, az, ez, egy, és, van, hogy
  • 字母 k 非常頻繁(複數後綴)
  • 字母 q 極少見(除明顯外來詞和少數專有名詞外,不使用該字母)

愛斯基摩-阿留申語族 Eskimo–Aleut

格陵蘭語 Greenlandic Kalaallisut

  • 長合成詞(單詞可達 30+ 字母)
  • 相對豐富的 n, q(不一定後接 u),u
  • 普遍雙輔音和元音(aa, ii, qq, uu,較少見 ee, oo
  • 元音 a, i, u 明顯較 e, o 頻繁(後者僅出現在 qr 前)
  • 無雙元音,除偶見詞尾 ai,輔音組合除雙輔音和 (n)ng 外僅為 r + 輔音
  • 舊拼寫(1973 年拼寫改革後廢除)有時包含尖音符、揚抑符、波浪號和/或字母 kraKʼ ĸ):Kʼânâĸ vs. Qaanaaq

南阿薩巴斯卡語系 Southern Athabaskan

  • 帶尖音符、鼻鉤或兩者的元音:á, ą, ą́
  • 雙元音:aa, áá, ąą, ą́ą́
  • 斜線 l:ł(注意區分波蘭語!)
  • 帶尖音符的 n:ń
  • 引號:' 或 ’
  • 序列:dl, tł, tł’, dz, ts’, ií, áa, aá
  • 可能出現較長詞

納瓦霍語 Navajo Diné bizaad

除上述外,

  • 不使用 u, ú, 或 ų

(梅斯卡萊羅/奇里卡瓦語)Mescalero/Chiricahua Mashgaléń/Chidikáágo

除上述外,

  • 使用:u, ú, ų
  • 不使用 o, ó, 或 ǫ

瓜拉尼語 Guaraní

  • 大量元音(包括 y)和 n 上的波浪號
  • g 上的波浪號:g̃——全球唯一使用該符號的語言。例詞:hagũag̃uahẽ
  • b, d, 和 g 通常不單獨出現,除非是西班牙語外來詞(mb, nd, ng)
  • f, l, q, w, x, z 在外來詞外極罕見
  • 不使用無 h 的 c:ch

日語羅馬字 Japanese Romaji 日本語ローマ字

  • 詞:desu, aru, suru,尤其句尾;
  • 詞尾:-masu, -masen, -shita
  • 字母:日語幾乎總在輔音和元音間交替。例外為雙字母 shichi,塞擦音 tsu,雙輔音(相同輔音連續出現)和顎化(輔音後接字母 y)。
  • 長音符或揚抑符可用於表示雙元音,如 Tōkyō
  • 常見詞:no, o, wa, de, ni

(注意:羅馬字不常用於日語書寫。主要用於外國人學習日語發音。)

苗語(羅馬化通俗字母書寫)Hmong/Hmoob

  • 幾乎所有書寫詞均極短(單音節)。
  • 音節(除非為中調)以聲調字母結尾:b s j v m g d 之一,導致看似“輔音組合”如 -wj
  • w 可為音節主元音(如 tswv
  • 音節可始於 hm-, ntxh-, nq- 等序列。
  • 音節以雙元音結尾(尤其 -oo, -ee),可能後接聲調字母(如 Hmoob “苗”)。

越南語 Vietnamese tiếng Việt

  • 羅馬字符,同一元音上多個附加符號。參見上文。
  • 幾乎所有書寫詞均極短(單音節,多數少於六字符)。
  • 詞始於 ngngh
  • 詞尾為 nh
  • 常見詞:cái, không, có, ở, của, và, tại, với, để, đã, sẽ, đang, tôi, bạn, chúng, là

越南語可讀引用(VIQR)

  • 元音後接以下字符(常組合):^ ( + ' ` ? ~ .
  • DD, Dd, 或 dd
  • 標點前接以下字符:\

越南語 VNI 編碼

  • 元音後接數字 1-8
  • D 或 d 後接數字 9
  • 數字前接以下字符:\

越南語 Telex 編碼

  • 元音後接以下字符:s f r x j
  • 以下元音雙寫:a e o
  • 以下字符後接字母 w:a o u
  • DD, Dd, 或 dd

漢語羅馬化 Chinese, Romanized

現代標準漢語 Standard Mandarin

  • 總體上,漢語音節僅以元音或 n, ng, r 結尾;從不以 p, t, k, m 結尾
漢語拼音 Pīnyīn
  • 詞始於 x, q, zh
  • 元音上聲調標記,如 ā, á, ǎ, à
    • 為方便計算機使用,有時以數字替代,如 a1, a2, a3, a4
威妥瑪拼音 Wade–Giles
  • 詞不始於 b, d, g, z, q, x, r
  • 詞始於 hs
  • 多連字符詞
  • 首字母或雙字母後接撇號,如 t'a, ch'i
國語羅馬字 Gwoyeu Romatzyh
  • 多不常見元音組合,如 ae, eei, ii, iee, oou, yy 等
  • 插入 r,如 arn, erng 等
  • 詞尾為 nn, nq

閩南語(白話字)Southern Min/Min-Nan Bân-lâm-gí/Bân-lâm-gú(Pe̍h-ōe-jī)

  • 多連字符詞。
  • 詞可結尾於 p, t, k, m, n, ng, h;從不以 r 結尾
  • 羅馬字符,元音上多附加符號。與越南語不同,每個字符最多一個符號。
  • 不常見組合字符,即 ·(中點,總在 o 後)和 |(豎線)。¯(長音符)亦常見。

南島語系 Austronesian

馬來語和印尼語 Malay/Indonesian bahasa Melayu/bahasa Indonesia

可能包含以下內容:
前綴:me-, mem-, memper-, pe-, per-, di-, ke-
後綴:-kan, -an, -i
其他(這些幾乎總小寫):yang, dan, di, ke, oleh, itu

馬來語和印尼語對熟練使用者互通,但譯員通常專精其一。參見標準馬來語和印尼語比較。

字母 'a' 使用頻繁(可比英語 'e')。

波利尼西亞語族 Polynesian

多數波利尼西亞語使用 A E F G H I K L M N O P R S T U V 和 ʻ(有時寫作 ' 或 Q)

    • L :核心波利尼西亞語(湯加語、薩摩亞語、圖瓦盧語、托克勞語等),如 fale
    • R :東波利尼西亞語(新西蘭毛利語、塔希提語、庫克群島毛利語、拉帕努伊語等),如 fare
    • K :多數波利尼西亞語,除夏威夷語、薩摩亞語、塔希提語外
    • H :多數波利尼西亞語,除薩摩亞語外
    • WH :新西蘭毛利語(whenua
  • 輔音總由一個或多個元音分隔(fenua, Haʻapai, ʻolelo)
  • 短元音和長元音,以長音符(āēīōū)或重複(aa, ee, ii, oo, uu)表示
  • 常見雙元音(oiaue, māori
  • 詞總以元音結尾
  • 外來詞轉寫(如日語):Sesu Kilisito=Jesus Christ, polokalama=program
  • 常見英語或法語外來詞(取決於殖民歷史)
湯加語 Tongan lea fakatonga
  • A E F H I K L M N NG O P S T U V ʻ
  • ng(Tonga),h,詞尾為 -onua(fonua
  • 冠詞 te
  • 常見詞:'o, te, ki, mei, i, faka-
  • 英語外來詞
薩摩亞語 Samoan gagana samoa
  • A E F G I L M N O P S T U V ʻ
  • 無 K 字母,使用 okina(ʻ)或無(湯加語中的 faka 在薩摩亞語中為 faʻa
  • 常見使用 L(le
  • 常見詞:o, e, le, se, a, i, ma
瓦利斯語 Wallisian lea faka'uvea
  • A E F G H I K L M N O P S T U V ʻ
  • 區別於湯加語:g 替代 ng(tokaga
  • 冠詞 te
  • h 較 s 更常見(tahi
  • 常見詞:ko, te, ki, mai, i, o, ne'e, e, mo, faka-
  • 法語外來詞
東富圖納語 East Futunan lea fakafutuna
  • A E F G H I K L M N O P S T U V ʻ
  • 冠詞 le
  • 常見詞:ko, le, ki, mei, i, o, mo, faka-
  • 區別於瓦利斯語:S 較 H 更常見(tasi
  • 區別於薩摩亞語:字母 K
  • 法語外來詞

突厥語族 Turkic

注意:部分突厥語如阿塞拜疆語和土庫曼語使用類似的拉丁字母(通常為 Jaŋalif)和相似詞彙,可能與土耳其語混淆。阿塞拜疆語有字母 Əə, Xx 和 Qq,土耳其語字母中無;土庫曼語有 Ää, Žž, Ňň, Ýý 和 Ww。拉丁字符獨特(或幾乎獨特)用於突厥語:Əə, Ŋŋ, Ɵɵ, Ьь, Ƣƣ, Ğğ, İ, 和 ı。所有突厥語可通過添加多個後綴形成長詞。

土耳其語 Turkish Türkçe/Türkiye_Türkçesi

土耳其語字母

小寫:a b c ç d e f g ğ h ı i j k l m n o ö p r s ş t u ü v y z

大寫:A B C Ç D E F G Ğ H I İ J K L M N O Ö P R S Ş T U Ü V Y Z

常見詞
  • bir — 一,一個
  • bu — 這
  • ancak — 但
  • oldu — 是(發生)
  • şu — 那
其他
  • 字母 "j" 僅用於外來詞。
  • 詞從不以 "ğ" 開頭
  • 注意常見詞尾。土耳其語動詞的時態變化通過在動詞後添加後綴實現。複數化通過添加 -lar 和 -ler 實現。
    • 常見時態變化:-yor -mış -muş -sun
    • 所有格/人稱:-im -un -ın -in -iz -dur -tır
    • 例:Yap ,"[他] 做了";Yap 是動詞詞幹,意為 "做",-mış 表示完成時,-tır 表示第三人稱(他/她/它)。
    • 例:Adalar,"島嶼";Ada 是名詞,意為 "島",-lar 使其變為複數。
    • 例:Evimiz,"我們的房子";Ev 是名詞,意為 "房子",-im 表示第一人稱所有者,-iz 使其變為複數。

阿塞拜疆語 Azeri Azərbaycanca

阿塞拜疆語可通過頻繁使用 ə 輕鬆識別。該字母在其他官方認可的現代拉丁字母中不使用。此外,它使用字母 xq,土耳其語中無。

  • 常見詞:, ki, ilə, bu, o, isə, görə, da,
  • 頻繁使用附加符號:ç, ğ, ı, İ, ö, ş, ü
  • 詞尾為 -lar, -lər, -ın, -in, -da, -də, -dan, -dən
  • 詞從不以 ğı 開頭
  • 詞很少以兩個或更多輔音開頭
  • 外來詞和名字轉寫,如 Audrey Hepburn = Odri Hepbern

漢語/汉语 Chinese

  • 無空格,除標點符號間(有時)外來詞間。
  • 阿拉伯數字(0-9)有時使用
  • 標點:
    • 句號 。(非 .)
    • 頓號 、(區別於逗號 ,)
    • 省略號 ……(六點)
  • 無平假名、片假名或諺文
  • 可能豎寫

简体中文 vs 繁體中文 Simplified Chinese/Traditional Chinese

注意:許多字符未簡化。因此,短詞或短語在簡體和繁體中常相同,但整句相同的情況罕見。

簡體和繁體中不同的常見部首:

  • 簡體:讠钅饣纟门(如 语 银 饭 纪 问)
  • 繁體:訁釒飠糹門(如 語 銀 飯 紀 問)

簡體和繁體中不同的常見字符:

  • 簡體:国 会 这 来 对 开 关 门 时 个 书 长 万 边 东 车 爱 儿
  • 繁體:國 會 這 來 對 開 關 門 時 個 書 長 萬 邊 東 車 愛 兒

標準書面漢語(基於普通話)vs 書面粵語(白話) Mandarin/Cantonese

注意:除中國香港外,中國大陸南部、馬來西亞和新加坡亦有粵語使用者,因此書面粵語可能以簡體或繁體書寫。

書面粵語中常見但普通話中無或罕見的字符:

  • 嘅 咗 咁 嚟 啲 唔 佢 乜 嘢 嗰 冇 睇

部分字符在所有字符編碼中不受支持,因此有時左側的口字旁被替換為 0o,如:

  • o既 0既

有時,粵語和普通話使用不同漢字表達相同意思。若在說或寫普通話時使用粵語常用字,母語者可能困惑甚至難以理解,反之亦然。例如:(粵語 vs 普通話)

  • 食vs吃(吃) 飲vs喝(喝) 企vs站(站) 凍vs冷(冷) 落vs下(下) 著vs穿(穿) 讀vs唸(讀) 鬧vs罵(罵) 計vs算(算) 咪vs別(別) 行vs走(走) 先vs才(才)

粵語中構建詞彙的漢字在現代普通話中無或少見。例如:(粵語 vs 普通話)

  • 成日vs整天(總是) 傾計vs聊天(聊天) 返工vs上班(上班) 溫書vs溫習(學習) 影片vs視頻(視頻) 隔離vs旁邊(旁邊) 起屋vs蓋樓(蓋樓) 聽日vs明天(明天) 巴閉vs囂張(囂張) 搞掂vs完成(完成) 定係vs還是(還是) 靚仔vs帥哥(帥哥) 鍾意vs喜歡(喜歡) 犀利vs厲害(厲害) 同埋vs和/及(和) 黐綫vs瘋的(瘋的) 雪櫃vs冰箱(冰箱)

粵語詞彙在中國大陸南部日常生活中使用,現代普通話中不用。例如:

  • 咪咁(別這樣) 好冇(好嗎) 玩嘢(玩花樣) 做嘢(工作) 睇戲(看電影) 唔知(不知道) 埋嚟(過來) 嗰個(那個) 咁嘅嘢(這樣的東西) 佢哋(他們) 咩事/乜事(什麼事) 冇嘢(沒事) 嗰陣(那時) 越嚟越多(越來越多) 我嘅(我的) 梗係(當然) 𥄫(偷看) 冧佢(喜歡他/她) 拎畀我(拿給我) 嘥曬(全浪費了) 你啱(你對) 𢫏住(蓋住) 冚唪唥(全部) 撳實(按緊) 瞓覺(睡覺) 掟石仔(扔小石頭) 唓(表示輕蔑的語氣詞) 噃(提醒或警告的語氣詞) 詏交(吵架) 好嬲(很生氣) 心悒(心裡鬱悶) 𧨾女仔(討好女孩) 得咁多咋(就這麼多) 做好咗(做好了)

最後,當其他國家(尤其美國和英國)的術語引入中國時,粵語和普通話常獲得不同翻譯,粵語常根據英語發音翻譯,普通話常根據意義翻譯。例如:(粵語 vs 普通話)

  • 的士(dik1 si2,無直接意義,根據英語發音翻譯。) vs 出租車(chū zū chē,意為出租的車。),翻譯自 Taxi。
  • 巴士(baa1 si2,無直接意義,根據英語發音翻譯。) vs 公車(gōng chē,意為公共的車。),翻譯自 Bus。
  • 多士(do1 si2,無直接意義,根據英語發音翻譯。) vs 土司(tǔ sī,無直接意義,根據英語發音翻譯。),翻譯自 Toast。
  • 騷(sou1,無直接意義,根據英語發音翻譯。) vs 秀(xìu,無直接意義,根據英語發音翻譯),翻譯自 Show。
  • 士多(si2 do1,無直接意義,根據英語發音翻譯) vs 小店(xiǎo diàn,意為小店),翻譯自 Store。
  • 𨋢(lip1,無直接意義,根據英語發音翻譯) vs 升降機(shēng jiàng jī,意為升降的機器),翻譯自 Lift/Elevator。
  • 掰拜(baai1 baai3,無直接意義,根據英語發音翻譯) vs 再見(zài jiàn,意為再見),翻譯自 Byebye/Goodbye。

日本語 にほんご Japanese

  • 片假名(カタカナ)和平假名(ひらがな)與日語漢字(漢字)混用
  • 無空格
  • 數字系統 = 阿拉伯數字(1,2,3 等)+ 漢字數字 (一,二,三等)
  • 標點:
    • 句號 。
    • 逗號 、(,亦用於雙字節)
    • 引號 「」
  • 偶見小字符旁大字符,如 しゃ りゅ しょ って シャ リュ ショ  ッテ
  • 雙勾號(稱為濁音)出現在字符右上,如 で が ず デ ガ ズ
  • 空圓圈(稱為半濁音)出現在字符右上,如 ぱ ぴ パ ぴ
  • 常見字符:の を は が
  • 原為豎寫(書籍、學校等),但在線多為橫寫。

韓語/朝鮮語 Korean 한국어/조선말

  • 西式標點符號
  • 西式空格
  • 諺文字母(拼音)如 ㅂ(b 在 book 中發音)ㅈ(j 在 jump 中發音)ㅅ(s 在 sock 中發音)ㅊ(ch 在 champion 中發音)ㅍ(p 在 pox 中發音)
  • 諺文字母組成音節塊;如 ㅅ s + ㅓ o + ㅇ ng = 성 song
  • 諺文中圓圈和橢圓常見;漢字中極罕見。
  • 總體外觀相對均勻,與漢語或日語對比。

高棉語 Khmer ភាសារខ្មែរ

高棉語使用獨特的高棉字母。

  • 極少使用空格
  • 字母形狀較其他婆羅米系文字“更高”
  • 使用高棉數字書寫 ១ ២ ៣ ៤ ៥ ៦ ៧ ៨ ៩
  • 較小版本輔音置於主輔音下,可能成簇
  • 24 個附加符號表示音節韻母 - ា ិ ី ឹ ឺ ុ ូ ួ ើ ឿ ៀ េ ែ ៃ េា ៅ ុំ ំ ាំ ះ ុះ េះ ោះ
  • 使用此為句號:។

希臘語 Greek Ελληνικά

現代希臘語使用希臘字母,以單調、多調或無調書寫,根據通俗(Triantafyllidis)語法或純正語法。部分人以希臘拉丁字母(Greeklish)書寫,可能為視覺、正字或語音基礎,或混亂(混合)。希臘語唯一官方正字形式為單調和多調。

正常現代希臘語(希臘單調)Greek Monotonic

  • και, είναι
  • 每個多音節詞有一個重音/聲調符號(oxia):ά έ ή ί ό ύ ώ
  • 唯一其他附加符號為分音符:ϊ/ΐ, ϋ/ΰ 等

1980 年代前希臘語(希臘多調)Greek Polytonic

純正語法通俗語法(Triantafylidis 語法)

  • 附加符號:ά, ᾶ, ἀ, ἁ, 及組合,其他元音亦同
  • 部分文本,尤其純正語法,亦有 ὰ, ᾳ, 與其他附加符號組合

古希臘語 Ancient Greek

  • 附加符號:ά, ὰ, ᾶ, ἀ, ἁ, ᾳ, 及組合,其他元音亦同;ῥ;波浪號(ᾶ)常似圓形揚抑符
  • 部分文本使用月形 sigma(似 c)替代 σ/ς

希臘無調 Greek Atonic

  • 常見於部分希臘媒體(電視);
  • 希臘字符無重音/聲調;
  • 詞:και, ειναι, αυτο

希臘拉丁字母 Greeklish

  • 存在希臘拉丁字母轉希臘語的自動轉換軟件。若發現希臘拉丁字母文本,轉換後可能對希臘語維基百科有用。
  • 注意:希臘拉丁字母中,一個字母可能對應多個字符。(例:th 對應 Θ(theta))。

正字希臘拉丁字母 Orthographic Greeklish

  • kai, einai

語音希臘拉丁字母 Phonetic Greeklish

  • ke, ine
  • omega 寫作 o;
  • ei, oi 寫作 i;
  • ai 寫作 e。

視覺基礎希臘拉丁字母 Visual-based Greeklish

  • omega(Ω 或 ω)可能寫作 W 或 w;
  • epsilon(E)可能寫作 3
  • alpha(A)可能寫作 4
  • theta(Θ)可能寫作 8
  • upsilon(Y)可能寫作 |/
  • gamma(γ)可能寫作 y
  • 一個字母可能對應多個字符。

混亂(混合)希臘拉丁字母 Messed-up (Mixed) Greeklish

  • kai, eine
  • 結合語音、視覺基礎和正字希臘拉丁字母,根據作者個人風格;
  • 最常見的希臘拉丁字母形式。

亞美尼亞語 Armenian Հայերեն

亞美尼亞語可通過其獨特的 39 字母字母表識別:

Ա Բ Գ Դ Ե Զ Է Ը Թ Ժ Ի Լ Խ Ծ Կ Հ Ձ Ղ Ճ Մ Յ Ն Շ Ո Չ Պ Ջ Ռ Ս Վ Տ Ր Ց Ւ Փ Ք ԵՎ(և) Օ Ֆ

格魯吉亞語和明格列爾 Georgian/Mingrelian ქართული/ქართული_ენა

格魯吉亞語可通過其獨特的字母表識別(注意部分字符已停用)。

ა ბ გ დ ე ვ ზ (ჱ) თ ი კ ლ მ ნ (ჲ) ო პ ჟ რ ს ტ (ჳ) უ ფ ქ ღ ყ შ ჩ ც ძ წ ჭ ხ (ჴ) ჯ ჰ (ჵ ჶ)

明格列爾語極少書寫,但使用格魯吉亞字母,並添加字母 ჸ ჷ。

西里爾字母 Cyrillic

加粗表示該語言獨有字母

斯拉夫語族 Slavic

白俄羅斯語 Belarusian беларуская

  • 使用:ё, і, й, ў, ы, э, ’
  • 特徵:шч 替代 щ
  • 唯一不使用 и 的西里爾語言。

保加利亞語 Bulgarian български

  • 使用:ъ, щ, я, ю, й
  • 唯一將 ъ 作為元音使用的斯拉夫語言;因此常出現在輔音間
  • 詞:със, в
  • 特徵:許多詞以定冠詞 –ът, –ят, –та, –то, –те 結尾

馬其頓語 Macedonian македонски

  • 使用:ј, љ, њ, џ, ѓ, ќ, ѕ
  • 詞:во, со
  • 特徵:р 常出現在輔音間,如 првин

黑山語 Montenegrin

  • 使用:З́, С́

俄語 Russian русский

  • 使用:ё(可選),й, ъ(罕見),ы, э, щ
  • 不使用:ґ, є, і, ї, љ, њ
  • 1918 年前俄語正字法使用 і, ѣ, ѳ(罕見),ѵ(極罕見);ъ 頻繁出現,主要用於詞尾

塞爾維亞語 Serbian српски

  • 使用:ј, љ, њ, џ, ђ, ћ
  • 不使用:ё, й, щ, ъ, ы, ь, э, ю, я
  • 詞:је, у
  • 特徵:大量輔音組合,如 српски

烏克蘭語 Ukrainian українська

  • 使用:є, и, і, ї, й, ґ, щ, ’
  • 不使用:ъ, ё, ы, э

蒙古語 Mongolian

  • 使用:ө, ү
  • 僅用於名字或外來詞:к, ф, щ

奧塞梯語 Ossetian

  • 使用:ӕ

阿拉伯字母 Arabic

  • 所有使用阿拉伯字母的語言從右至左書寫。
  • 部分語言過去使用阿拉伯字母,現更常用拉丁字母;例如土耳其語、索馬里語和斯瓦希里語。

阿拉伯語 Arabic العربية

  • 倒置問號:؟
  • 短元音不書寫,因此許多詞無元音
  • 常見前綴:-الـ
  • 常見後綴: ة -ـة-
  • 詞:إلى، من، على

波斯語 Persian فارسی

除極罕見情況外,動詞總在短語末尾。

  • 常見動詞:کرد، بود، شد، است، می‌شود
  • 使用:پ، چ، ژ، گ
  • 詞:که، به

烏爾都語 Urdu اردو

  • 使用:‮ٹ‎، ڈ‎، ڑ‎، ں، ے
  • 許多詞以 ے 結尾
  • 詞:اور، ہے
  • 區別於阿拉伯語:許多文本中,烏爾都語以“傾斜”風格書寫,詞從右上至左下“傾斜”(與阿拉伯語、波斯語等的“線性”風格不同)。

敘利亞字母 Syriac

敘利亞語 ܐܬܘܪܝܐ

  • 短元音通常不書寫,因此許多詞無元音
  • 三種書寫風格(estrangela, serto, mahdnaya)和兩種元音表示方式
  • estrangela 風格基本字母:ܐ ܒ ܓ ܕ ܗ ܘ ܙ ܚ ܛ ܝ ܟ ܠ ܡ ܢ ܣ ܥ ܦ ܨ ܩ ܪ ܣ ܬ
  • serto 風格基本字母:ܬ‎, ܫ‎, ܪ‎, ܩ‎, ܨ‎, ܦ‎, ܥ‎, ܣ‎, ܢ‎, ܡ‎, ܠ‎, ܟ‎, ܝ‎, ܛ‎, ܚ‎, ܙ‎, ܘ‎, ܗ‎, ܕ‎, ܓ‎, ܒ‎, ܐ‎
  • madnhaya 風格基本字母:ܬ‎,ܫ‎,ܪ‎,ܩ‎,ܨ‎,ܦ‎,ܥ‎,ܣ‎,ܢ‎,ܡ‎,ܠ‎,ܟ‎,ܝ‎,ܛ‎,ܚ‎,ܙ‎,ܘ‎,ܗ‎, ܕ‎,ܓ‎,ܒ‎,ܐ‎

達羅毗荼語系 Dravidian languages

  • 所有達羅毗荼語從左至右書寫。
  • 所有達羅毗荼語有不同文字。但其正字法有相似性。

卡納達語 Kannada

  • 卡納達語有 49 字母字母表。

泰米爾語 Tamil

  • 常見詞尾:ள்ளது, கிறது, கின்றன, ம்
  • 常見詞:தமிழ், அவர், உள்ள, சில
  • 泰米爾語有獨特的 30 字母字母表。借助附加符號,可書寫多達 247 字母。

அ ஆ இ ஈ உ ஊ எ ஏ ஐ ஒ ஓ ஔ க ங ச ஞ ட ண த ந ப ம ய ர ல வ ழ ள ற ன

泰盧固語 Telugu

泰盧固語有 56 字符(Aksharamulu),包括元音(Achchulu)和輔音(Hallulu)。泰盧固語使用十八個元音,每個元音有獨立形式和與輔音組合形成音節的附加符號形式。語言區分短元音和長元音。

అ ఆ ఇ ఈ ఉ ఊ ఋ ౠ ఌ ౡ ఎ ఏ ఐ ఒ ఓ ఔ అం అః క ఖ గ ఘ ఙ చ ఛ జ ఝ ఞ ట ఠ డ ఢ ణ త థ ద ధ న ప ఫ బ భ మ య ర ఱ ల ళ వ శ ష స హ

౦ ౧ ౨ ౩ ౪ ౫ ౬ ౭ ౮ ౯

孟加拉語 Bengali

孟加拉字母或孟加拉文(孟加拉語:বাংলা বর্ণমালা, bangla bôrnômala)或孟加拉文字(孟加拉語:বাংলা লিপি, bangla lipi)是源自印度次大陸的書寫系統,用於孟加拉語,是世界第五大廣泛使用的書寫系統。該文字亦用於阿薩姆語、邁蒂利語、梅泰語和比什奴普里亞曼尼普爾語,歷史上亦用於書寫孟加拉地區的梵語。

孟加拉語 Bengali

孟加拉語有獨特的 50 字母字母表。

  • 孟加拉文字共有 9 個元音字母,每個稱為 স্বরবর্ণ swôrôbôrnô "元音字母"。swôrôbôrnôs 表示孟加拉語七個主要元音中的六個,及兩個元音雙元音。所有這些均用於孟加拉語和阿薩姆語。

অ আ ই ঈ উ ঊ ঋ এ ঐ ও ঔ

  • 孟加拉文字共有 39 個輔音字母。輔音字母在孟加拉語中稱為 ব্যঞ্জনবর্ণ bænjônbôrnô "輔音字母"。字母名稱通常為輔音音加固有元音 অ ô。由於固有元音假設且不書寫,多數字母名稱與字母本身相同(字母 ঘ 的名稱為 ghô,非 gh)。

ক খ গ ঘ ঙ চ ছ জ ঝ ঞ ট ঠ ড ঢ ণ ত থ দ ধ ন প ফ ব ভ ম য র ৰ ল ৱ শ ষ স হ ড় ঢ় য় ৎ ঃ ং ঁ

  • 有 10 個附加符號表示音節韻母 -

া ি ী ু ূ ৃ ে ৈ ো ৌ

阿薩姆語 Assamese

  • 阿薩姆文字共有 9 個元音字母,每個稱為 স্বরবর্ণ swôrôbôrnô "元音字母"。

অ আ ই ঈ উ ঊ ঋ এ ঐ ও ঔ

  • 共有 39 個輔音字母。輔音字母在孟加拉語中稱為 ব্যঞ্জনবর্ণ bænjônbôrnô "輔音字母"。

ক খ গ ঘ ঙ চ ছ জ ঝ ঞ ট ঠ ড ঢ ণ ত থ দ ধ ন প ফ ব ভ ম য ৰ ল শ ষ স হ ড় ঢ় য় ৎ ঃ ং ঁ

  • 有 10 個附加符號表示音節韻母 -

া ি ী ু ূ ৃ ে ৈ ো ৌ

加拿大原住民音節文字 Canadian Aboriginal syllabics

現代書寫中,加拿大原住民音節文字指示克里語、因紐特語或奧吉布瓦語,後兩者亦以其他文字書寫。基本字形為 ᐁ ᐱ ᑌ ᑫ ᒉ ᒣ ᓀ ᓭ ᔦ,每個可出現在四種方向、加粗、上標及帶附加符號,包括 ᑊ ᐟ ᐠ ᐨ ᒼ ᐣ ᐢ ᐧ ᐤ ᐦ ᕽ ᓫ ᕑ。該元音附標文字亦用於黑腳語。

其他北美音節文字 Other North American syllabics

切羅基語 Cherokee

切羅基語書寫使用獨特的音節文字,包含以下字符:

ᎡᎢᎣᎤᎥᎦᎧᎨᎩᎪᎫᎬᎭᎮᎯᎰᎱᎲᎳᎴᎵᎶᎷᎸᎹᎺᎻᎼᎽᎾᎿᏀᏁᏂᏃᏄᏅᏆᏇᏈᏉᏊᏋᏌᏍᏎᏏᏐᏑᏒᏓᏔᏕᏖᏗᏘᏙᏚᏛᏜᏝᏞᏟᏠᏡᏢᏣᏤᏥᏦᏧᏨᏩᏪᏫᏬᏭᏮᏯᏰᏱᏲᏳᏴ。

人工語言 Conlang

世界語 Esperanto

  • 詞:de, la, al, kaj
  • 六個帶重音符號的字母:ĉ Ĉ ĝ Ĝ ĥ Ĥ ĵ Ĵ ŝ Ŝ ŭ Ŭ,其對應正字法的 H 系統表示 ch Ch gh Gh hh Hh jh Jh sh Sh u U 或其對應的 X 系統表示 cx Cx gx Gx hx Hx jx Jx sx Sx ux Ux
  • 詞尾為 o, a, oj, aj, on, an, ojn, ajn, as, os, is, us, u, i,

克林貢語 tlhIngan Hol

  • 以拉丁字母書寫時,克林貢語有大小寫區分;qQ 為不同字母,其他字母或總大寫(如 D, I, S)或從不大寫(如 ch, tlh, v)。這導致大量詞對不習慣者看起來奇怪,如:yIDoghQo', tlhIngan Hol(大小寫混合)。
  • 撇號頻繁,尤其在詞或音節末尾。
  • 常見後綴:-be', -'a'
  • 常見詞:'oH, Qapla'
  • 詞中可能出現一個或多個撇號:SuvwI″a'

邏輯語 lojban.

  • (幾乎)全小寫;
  • 常見詞 lo, mi, cu, la, nu, do, na, se
  • 段落以 ni'o 分隔,句子以 .i(或 i)分隔;
  • 大量五字母詞,輔音-元音結構 CCVCVCVCCV
  • 大量帶撇號的短詞,如 ko'a pi'o 等;
  • 通常無標點,除點外;
  • 詞中可能使用逗號(通常為專有名詞)。

道本語 toki pona

  • 字母全小寫,除名字/外來詞外
  • 無附加符號
  • 僅使用清輔音書寫,如 p, t, k

完整字母表:p, t, k, s, m, n, l, j, w, a, e, i, o, u

  • 常見詞 li, mi, e, sina, ona, jan
  • 常似簡化且語音的英語或瑞典語
  • 大量雙音節詞
  • ji ti wu wo 音節
Loading comments...