📝📝:人才多、英文好,為什麼印度沒造出世界級 AI?|數百種在地語言成為最大阻力

更新於 發佈於 閱讀時間約 9 分鐘

儘管印度是全球科技重鎮、擁有人才優勢,但在本土 AI 發展方面卻長期落後於美國與中國。

本文參考自《麻省理工科技評論》(MIT Technology Review)的文章《Inside India’s scramble for AI independence》




2025 年初,當 DeepSeek-R1 正式發表的那一刻,印度科技圈瞬間掀起波瀾。這款中國開發的 AI 模型,以遠低於西方同類產品的資本與時間成本,達成了可與世界頂尖模型匹敵的性能標竿。

對印度 AI 社群而言,這不只是又一場產品發表會而是一記警鐘,清楚指出印度在全球 AI 競賽中的潛力與現實落差。

印度 AI 建設者的兩種反應,恰如其分地反映出這個國家與人工智慧發展之間複雜的關係。印度當地的開源新創公司 CognitiveLab 創辦人 Adithya Kolavi 從 DeepSeek 的成功中汲取靈感:

「這正是資源有限也能顛覆現狀的方式。如果 DeepSeek 做得到,我們為何不能?」

與此同時,多語言 AI 模型 Pragna-1B 的開發者 Abhishek Upperwal 則因資金匱乏導致項目受挫而感到遺憾:

「如果我們兩年前就獲得資金,也許現在打造出這款產品的就是我們。」

這兩種觀點的對比,呈現了印度在實現 AI 開發上所面臨的更大挑戰。儘管印度是全球科技重鎮、擁有人才優勢,但在本土 AI 發展方面卻長期落後於美國與中國。




高度仰賴服務業,而非新創

印度在 AI 發展上的困境,來自其傳統優勢與尖端 AI 研究所需條件之間的基本錯位。

印度的科技產業是以「服務導向」的模式發展起來的,像 InfosysTCS 等 IT 巨頭的成功,依賴的是高效的軟體交付流程,而非技術上的突破創新。這種模式雖在經濟上卓有成效,卻也形塑出一個創新既不被優先考慮,也缺乏足夠獎勵機制的產業生態。

印度的科技產業依賴的是高效的軟體交付流程,而非技術上的突破創新。

印度的研發支出僅占 GDP 的 0.65%,相當於 2024 年的 254 億美元;相比之下,中國為 2.68%(4762 億美元),美國更高達 3.5%(9623 億美元)。在研發投入長期不足的情況下,印度未能建立起發展深層科技(從高階演算法到專用晶片)所需的制度性能力。

雖然在國防研究發展組織(DRDO)與印度太空研究組織(ISRO)等政府機構中仍存在世界級的研究成果,但這些技術突破極少能轉化為民用或商業應用。與美國的 DARPA(國防高等研究計畫署)不同,後者能有效將高風險研究與商業化道路相連結,但印度缺乏能將研究成果推向市場的制度橋梁。

人才外流問題更是雪上加霜。印度頂尖的 AI 專才大量外流,流向更懂得資助深科技研發、也更具吸引力的海外生態系。這場人才的流失,進一步削弱了印度在全球 AI 領域的競爭力。


多達 22 種官方語言

除了資金與制度障礙,印度還面臨一項其他國家極少遭遇的特殊挑戰:語言多樣性極其龐大。

印度擁有 22 種官方語言、數百種方言,以及數以百萬計的多語言使用者,這樣的語言環境對現有大型語言模型(LLM)構成了極高挑戰。印度的憲法在第八附表(Eighth Schedule)中,列出了 22 種受到保護的法定語言,分別是:

  1. 阿薩姆語(Assamese)
  2. 孟加拉語(Bengali)
  3. 博多語(Bodo)
  4. 多格拉語(Dogri)
  5. 古吉拉特語(Gujarati)
  6. 印地語(Hindi)
  7. 坎納達語(Kannada)
  8. 克什米爾語(Kashmiri)
  9. 孔卡尼語(Konkani)
  10. 邁蒂利語(Maithili)
  11. 馬拉雅拉姆語(Malayalam)
  12. 曼尼普爾語(Manipuri)
  13. 馬拉地語(Marathi)
  14. 尼泊爾語(Nepali)
  15. 奧里亞語(Odia)
  16. 旁遮普語(Punjabi)
  17. 梵語(Sanskrit)
  18. 桑塔利語(Santhali)
  19. 信德語(Sindhi)
  20. 泰米爾語(Tamil)
  21. 泰盧固語(Telugu)
  22. 烏爾都語(Urdu)

這些語言被認可,在印度各邦和中央政府的官方事務中都具有一定的地位和使用權。

儘管印度人普遍英文不錯,也有大量高品質的英文網路資料,但印度語言在網路上的內容總量卻不到 1%。

儘管印度人普遍英文不錯,也有大量高品質的英文網路資料,但印度語言在網路上的內容總量卻不到 1%。

對於如「博杰普爾語」(Bhojpuri)「康納達語」(Kannada)這類語言而言,幾乎找不到數位化、標註齊全、經過清理的語料。這使得訓練能夠理解印度人實際溝通方式或搜尋行為的 LLM 變得極為困難。

技術層面也問題重重。現有能將文字切割為 AI 可處理單元的技術的分詞器(tokenizers),面對印度各種文字系統時表現不佳,常常誤解或遺漏字符。即便某些多語言模型納入了印度語言,表現通常也很差,產出內容不準確或語義錯亂。

印度語言的複雜程度更甚於英文。

許多語言使用拼寫複雜的文字與黏著語法(agglutinative grammar),詞彙由眾多前後綴結合而成,承載的資訊量巨大。

印度許多語言不同於英文,沒有明確空格分詞且語法結構較單純,像印地語(Hindī)泰米爾語(Tamiḻ)等語言往往詞與詞之間缺乏明確邊界,單一詞彙即含有多重語意。

這些元素的堆疊都讓標準分詞器難以正確處理,導致詞彙被拆解為過多片段,使模型理解困難、反應準確率下降。



IndiaAI 計畫:全方位戰略藍圖

2025 年 4 月,印度政府目標在 2025 年底前開發六個大型語言模型,並推出另外 18 項針對關鍵領域(如農業、教育與氣候行動)的 AI 應用。最值得注意的是,政府選定 Sarvam AI 開發一個專為印度語言與本地需求優化的 700 億參數模型。

此項行動屬於更宏大的「IndiaAI 計畫」的一環。該計畫於 2024 年 3 月啟動,總預算達 12.5 億美元,目標是建構印度核心的 AI 基礎設施,並讓先進工具更廣泛可得。

IndiaAI 計畫於 2024 年 3 月啟動,總預算達 12.5 億美元,目標是建構印度核心的 AI 基礎設施。來源:維基百科

IndiaAI 計畫於 2024 年 3 月啟動,總預算達 12.5 億美元,目標是建構印度核心的 AI 基礎設施。來源:維基百科

IndiaAI 計畫電子與資訊科技部(Ministry of Electronics and Information Technology, MeitY)主導,此計畫聚焦於支援 AI 新創企業,尤其是那些開發印度語言基礎模型,並將 AI 應用於醫療、教育與農業等關鍵領域的公司。

在運算資源計畫下,政府正部署超過 18,000 顆 GPU,包括近 13,000 顆高階 H100 晶片,提供給一批精選的印度新創公司使用;包括 Sarvam、Upperwal 的 Soket LabsGnani AI。此任務同時涵蓋其他重要規劃,包括建立全國多語言資料集庫、在中小型城市設立 AI 實驗室,以及資助深科技(deep-tech)研發。

根據 IndiaAI 執行長、同時為 MeitY 官員的 Abhishek Singh 表示,印度針對深科技的全面推動,預期在未來五年內帶來約 120 億美元的研發投資。

Abhishek Singh 強調,IndiaAI 計畫本身預估將挹注約 1.62 億美元,當中約 3200 萬美元專門用於直接資助新創企業。另有「國家量子任務」(National Quantum Mission)將投入 7.3 億美元,支援印度的量子研究雄心。

IndiaAI 執行長、MeitY 官員的 Abhishek Singh。來源:LinkedIn

IndiaAI 執行長、MeitY 官員的 Abhishek Singh。來源:LinkedIn

此外,2025–26 年度的國家預算文件中,亦宣佈設立一項總額 12 億美元的「深科技基金母基金」(Deep Tech Fund of Funds),目標是促進私部門早期創新的活力。

其餘的 99 億美元資金,預計來自私人與國際來源,包括企業研發投資、創投公司、高資產個人、慈善組織,以及如 Microsoft 等全球科技領導企業。



專精特定層級的技術

隨著印度的 AI 野心逐漸明朗,更廣泛的戰略討論也隨之展開。在邦加羅爾舉辦的 Meta 高峰會上,Infosys 主席 Nandan Nilekani 呼籲印度應避免追隨「仿製的 AI 夢想」。

「讓矽谷的巨頭去做吧,」Nilekani 針對大型語言模型的建構如此表示。

「我們的角色應該是用來創建合成資料,快速建構小型語言模型(small language model),並以合適的資料進行訓練。」

他的觀點雖然引起分歧,但也逐漸凝聚共識:

印度是否應該選擇一條與全球強權截然不同的 AI 發展路線。

「想要主宰每一層技術堆疊是不切實際的,即便對中國也是如此,」印度政策智庫 Takshashila Institution 研究員 Shobhankita Reddy 指出:

「重點在於主導某一層級,例如應用、服務或人才培育,確保你在全球 AI 鏈中不可或缺。」








留言
avatar-img
留言分享你的想法!
avatar-img
社會人的哲學沉思
132會員
282內容數
從物理到電機工程再轉到資訊傳播,最後落腳在社會學。衣櫃拿來當書櫃擺的人。我常在媒介生態學、傳播理論、社會學、心理學、哲學游移;期盼有天無產階級可以推倒資本主義的高牆的兼職家教。
2025/08/05
身體的臨場反應跑得比意識快多了,而 VR 的「虛擬」視覺足以召喚出身體真實的恐懼。VR 沒有欺騙我,只是讓我的身體提早感受到那個不存在的世界。
Thumbnail
2025/08/05
身體的臨場反應跑得比意識快多了,而 VR 的「虛擬」視覺足以召喚出身體真實的恐懼。VR 沒有欺騙我,只是讓我的身體提早感受到那個不存在的世界。
Thumbnail
2025/08/01
AI 所提供的即時寫作建議確實提升了效率與流暢度。然而,近期的研究警告,在便利性之下,潛藏著一種更深層且經常被忽視的危機:全球語聲的文化同質化。
Thumbnail
2025/08/01
AI 所提供的即時寫作建議確實提升了效率與流暢度。然而,近期的研究警告,在便利性之下,潛藏著一種更深層且經常被忽視的危機:全球語聲的文化同質化。
Thumbnail
2025/07/29
儘管高達 97% 的招募人員高度依賴,但 LinkedIn 上的職缺申請,實際錄取率卻僅為 0.8%。
Thumbnail
2025/07/29
儘管高達 97% 的招募人員高度依賴,但 LinkedIn 上的職缺申請,實際錄取率卻僅為 0.8%。
Thumbnail
看更多
你可能也想看
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
AI高速發展,現今一天的變幻超過古代十年的發展,不少人對未來充滿焦慮、迷茫,但一直以來都有一項能力,不僅人人都能學、還無法被AI取代﹔而貫穿古今,只要精通這能力,人生普遍差不了…
Thumbnail
AI高速發展,現今一天的變幻超過古代十年的發展,不少人對未來充滿焦慮、迷茫,但一直以來都有一項能力,不僅人人都能學、還無法被AI取代﹔而貫穿古今,只要精通這能力,人生普遍差不了…
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
全世界都在瘋AI,而且瘋狂的是台灣的AI 在這波浪潮中,台灣能支撐多久?
Thumbnail
全世界都在瘋AI,而且瘋狂的是台灣的AI 在這波浪潮中,台灣能支撐多久?
Thumbnail
如何運用A I這個工具,以人為本,不是讓AI主導你的人生。
Thumbnail
如何運用A I這個工具,以人為本,不是讓AI主導你的人生。
Thumbnail
以下都是轉貼各方觀點,重點可以進一步看發表者跟回應者,我自己也有自身應用場景的murmur : 低利率環境可能回不去 科技掌握在大資金公司時代則是持續下去 工業時代引導一波人才需求 東方社會喜歡考試定生死 學校教育外還有補習班可以協助 既然AI工具隨處可得 培養厚植的各方素養與多元興趣
Thumbnail
以下都是轉貼各方觀點,重點可以進一步看發表者跟回應者,我自己也有自身應用場景的murmur : 低利率環境可能回不去 科技掌握在大資金公司時代則是持續下去 工業時代引導一波人才需求 東方社會喜歡考試定生死 學校教育外還有補習班可以協助 既然AI工具隨處可得 培養厚植的各方素養與多元興趣
Thumbnail
- AI機器人也能懂果實成熟度!5G遠端遙控成農村缺工解方 | 遠見雜誌 - 全球最大半導體展會上海閉幕 擺脫美國控制成焦點|工商時報 - 減少依賴中台技術!美國考慮和墨西哥合作開發半導體供應鏈|科技新報 - 中國政府機構禁用 Intel 和 AMD 台廠受惠、受害有限|經濟日報
Thumbnail
- AI機器人也能懂果實成熟度!5G遠端遙控成農村缺工解方 | 遠見雜誌 - 全球最大半導體展會上海閉幕 擺脫美國控制成焦點|工商時報 - 減少依賴中台技術!美國考慮和墨西哥合作開發半導體供應鏈|科技新報 - 中國政府機構禁用 Intel 和 AMD 台廠受惠、受害有限|經濟日報
Thumbnail
已經成真的AI生成文字、圖片、音樂、影片,以及接下來更多的AI運用場景,每一項都將對人類社會產生重大的影響:包括抽象的人心、文化、審美、親密關係,以及實質的就業、經濟、生活、生涯規劃等。 本文我會以大量使用、測試AI的經驗,輔以田野調查的經驗,詳細說明AI時代最應該培養的四項能力。
Thumbnail
已經成真的AI生成文字、圖片、音樂、影片,以及接下來更多的AI運用場景,每一項都將對人類社會產生重大的影響:包括抽象的人心、文化、審美、親密關係,以及實質的就業、經濟、生活、生涯規劃等。 本文我會以大量使用、測試AI的經驗,輔以田野調查的經驗,詳細說明AI時代最應該培養的四項能力。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
- 台印度簽MOU 移工來源國+1|工商時報 - ASML 超越應材,成全球最大晶圓廠設備製造商|科技新報 - OpenAI推「文字生成影音」 包含複雜場景、特定動作等正確細節|經濟日報 - Satya Nadella 任微軟 CEO 十周年,他做對哪 4 件事讓公司市值翻 10 倍?|INSIDE
Thumbnail
- 台印度簽MOU 移工來源國+1|工商時報 - ASML 超越應材,成全球最大晶圓廠設備製造商|科技新報 - OpenAI推「文字生成影音」 包含複雜場景、特定動作等正確細節|經濟日報 - Satya Nadella 任微軟 CEO 十周年,他做對哪 4 件事讓公司市值翻 10 倍?|INSIDE
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News