欧州委員会 EU資金によるTildeOpen LLMが、多言語イノベーションに向けた欧州のAI技術革新を実現 (2025.09.29)
こんにちは、丸山満彦です。
EUの資金で開発されているTildeOpen LLMという欧州言語(主に東欧・バルト諸国言語)向けに最適化された300億パラメータの言語モデルがリリースされていますね...
欧州の価値観ですね...
● European Commission
・2025.09.29 EU-funded TildeOpen LLM delivers European AI breakthrough for multilingual innovation
| EU-funded TildeOpen LLM delivers European AI breakthrough for multilingual innovation | EU資金によるTildeOpen LLMが、多言語イノベーションに向けた欧州のAI技術革新を実現した。 |
| Tilde has launched a powerful open-source language model trained on Europe's LUMI supercomputer. | Tildeは欧州のLUMIスーパーコンピュータで訓練された強力なオープンソース言語モデルを発表した。 |
| Tilde, a winner of the European AI Grand Challenge has released TildeOpen LLM, a powerful 30-billion parameter language model optimised for European languages. The model was trained using the 2 million GPU hours awarded through the AI Grand Challenge on the EuroHPC LUMI supercomputer, demonstrating Europe's capacity to develop world-class AI infrastructure in under a year. | 欧州AIグランドチャレンジの優勝企業であるTildeは、欧州言語向けに最適化された300億パラメータの強力な言語モデル「TildeOpen LLM」をリリースした。このモデルは、欧州HPC(EuroHPC)のLUMIスーパーコンピュータ上で実施されたAIグランドチャレンジを通じて付与された200万GPU時間を使用して訓練された。これは欧州が1年未満で世界クラスのAIインフラを開発する能力を有することを示している。 |
| Key achievements: | 主な成果: |
| ・State-of-the-art performance across all 24 EU official languages, plus Ukrainian, Norwegian, and several Balkan languages | ・EU公用語24言語全てに加え、ウクライナ語、ノルウェー語、複数のバルカン諸言語において最先端の性能を発揮 |
| ・Superior efficiency compared to leading global models—smaller, faster, and more accessible | ・主要なグローバルモデルと比較して優れた効率性——より小型、高速、かつアクセスしやすい |
| ・Full compliance with the European AI Act | ・欧州AI法の完全準拠 |
| ・Data security maintained within EU infrastructure | ・EUインフラ内でのデータセキュリティ維持 |
| Thanks to the Large AI Grand Challenge , Tilde has successfully trained TildeOpen. This milestone shows how the Large AI Grand Challenge is not just a competition but a catalyst for real-world innovation, enabling European researchers and companies to deliver AI breakthroughs that strengthen Europe’s digital sovereignty. Without the GPU hours awarded, this achievement would not have been possible. | 大規模AIグランドチャレンジのおかげで、TildeはTildeOpenの訓練に成功した。この成果は、同チャレンジが単なる競争ではなく、欧州の研究者や企業が欧州のデジタル主権を強化するAIの突破口を実現する現実世界のイノベーションの触媒であることを示している。GPU時間の提供がなければ、この成果は達成できなかった。 |
| TildeOpen LLM provides governments, businesses, and researchers with a secure, open-source foundation for customised AI applications—from customer service to advanced research. The model is now available on Hugging Face, with availability on the European AI on Demand Platform coming soon. | TildeOpen LLMは、政府・企業・研究者にカスタマイズ可能なAIアプリケーション基盤を提供する。顧客サービスから先端研究まで対応する安全なオープンソース基盤だ。本モデルはHugging Faceで公開中であり、欧州AIオンデマンドプラットフォームでの提供も間もなく開始される。 |
| This breakthrough underscores the EU's commitment to fostering a sovereign, multilingual, and trustworthy AI ecosystem through strategic investment in European innovation. | この画期的な成果は、欧州のイノベーションへの戦略的投資を通じ、主権的・多言語・信頼性の高いAIエコシステム構築に向けたEUの決意を裏付けるものである。 |
Webページはこちら...
● Tiede - TildeOpen LLM
FAQがあるので、参考に...
| Frequently asked questions | よくある質問 |
| What is TildeOpen LLM? | TildeOpen LLMとは何か? |
| The TildeOpen LLM project aims to create a multilingual foundational large language model that focuses on underrepresented Baltic and Eastern European languages to promote digital equity and enhance access to advanced AI technologies for these communities. | TildeOpen LLMプロジェクトは、バルト諸国や東欧の言語といった、これまで十分に扱われてこなかった言語に焦点を当てた多言語基盤大規模言語モデル(LLM)の構築を目指す。これによりデジタル格差の是正を図り、これらのコミュニティが先進的なAI技術にアクセスしやすくすることを目的としている。 |
| Why is language equity in LLMs important? | LLMにおける言語の公平性が重要な理由 |
| This imbalance has efficiency and cost consequences. For instance, longer sequences are required to encode the same amount of information in lower-resourced languages compared to English, making models less efficient and more expensive to run. Additionally, the English-centricity of these models can introduce undesirable cultural biases. TildeOpen will be trained to ensure equity for all supported languages. | この不均衡は効率性とコストに影響する。例えば、英語に比べてリソースの少ない言語では、同じ情報を表現するためにより長い文字列が必要となるため、モデルの効率性が低下し、運用コストが高くなる。さらに、これらのモデルの英語中心性は望ましくない文化的バイアスをもたらす可能性がある。TildeOpenは、サポートする全ての言語に対して公平性を確保するよう訓練される。 |
| What languages does the TildeOpen project focus on? | TildeOpenプロジェクトはどの言語に焦点を当てているのか? |
| The project targets Eastern European and Baltic languages such as Bulgarian, Croatian, Czech, Estonian, Finnish, Latvian, Lithuanian, Macedonian, Montenegrin, Polish, Serbian, Slovak, Slovene, and Ukrainian. The model will also support bigger languages such as English, French, German and Russian in balanced proportions to support translation and related multilingual tasks. | 本プロジェクトは、ブルガリア語、クロアチア語、チェコ語、エストニア語、フィンランド語、ラトビア語、リトアニア語、マケドニア語、モンテネグロ語、ポーランド語、セルビア語、スロバキア語、スロベニア語、ウクライナ語といった東欧・バルト諸国言語を対象とする。また、翻訳や関連する多言語タスクを支援するため、英語、フランス語、ドイツ語、ロシア語といった主要言語も均衡の取れた割合でサポートする。 |
| What does a “foundational model” mean? | 「基盤モデル」とは何を意味するのか? |
| A foundational model is a large, general-purpose AI model trained on a broad range of data. It serves as the “base” for building more specialised tools like internal virtual assistants, chatbots, or industry-specific AI applications. Once trained, it can be fine-tuned with specific data to perform targeted tasks more accurately and reliably. | 基盤モデルとは、広範なデータで訓練された大規模な汎用AIモデルである。社内仮想アシスタント、チャットボット、業界特化型AIアプリケーションなど、より専門的なツールを構築するための「基盤」として機能する。一度訓練されると、特定のデータで微調整され、対象タスクをより正確かつ確実に実行できるようになる。 |
| What is the LUMI supercomputer? | LUMIスーパーコンピュータとは何か? |
| The LUMI (Large Unified Modern Infrastructure) supercomputer is the fifth fastest supercomputer globally and the fastest in Europe. It is part of the EuroHPC Joint Undertaking, a collaborative effort involving the European Union and European countries to create a world-class high-performance computing (HPC) ecosystem in Europe. The LUMI supercomputer is located in Kajaani, Finland. | LUMI(Large Unified Modern Infrastructure)スーパーコンピュータは、世界で5番目に高速なスーパーコンピュータであり、欧州最速である。欧州連合と欧州諸国が協力して欧州に世界クラスの高性能計算(HPC)エコシステムを構築する取り組み「EuroHPC共同事業」の一環である。LUMIスーパーコンピュータはフィンランドのカヤニに設置されている。 |
| What is the Large AI Grand Challenge? | 大規模AIグランドチャレンジとは何か? |
| The purpose of the Large AI Grand Challenge, funded by the European Commission, is to expand European AI frontiers by harnessing the potential of large-scale AI models. The participants in the competition were innovative startups and SMEs with the technical capacity to develop AI models that boost Europe’s competitiveness in Generative AI. The European Commission has announced the winners of the Large AI Grand Challenge. Four innovative AI companies from Europe, including Tilde, will share a prize of €1 million and 8 million computational hours to advance Europe's leadership in AI development. | 欧州委員会が資金提供した大規模AIグランドチャレンジの目的は、大規模AIモデルの可能性を活用して欧州のAIフロンティアを拡大することだ。このコンペティションの参加者は、生成AI分野における欧州の競争力を高めるAIモデルを開発する技術力を持つ革新的なスタートアップや中小企業だった。欧州委員会は、大規模AIグランドチャレンジの受賞者を発表した。Tildeを含む欧州の革新的なAI企業4社が、100万ユーロの賞金と800万計算時間を分け合い、欧州のAI開発におけるリーダーシップを推進する。 |
| What is Tilde? | Tildeとは何か? |
| Tilde is a leading European language technology innovator and service provider with a mission to promote language diversity in the digital age. Tilde has over 150 employees in three offices located in Riga, Vilnius, and Tallinn. Tilde’s research team is comprised of nine PhDs and their research associates and has authored over 260 scientific publications. Over the years, Tilde has developed a vast R&D partnership network with leading EU research centres and universities and serves as a language technology research hub for the Baltic region.Most recent research and development activities of Tilde are focused on foundational large language models (LLMs), fine-tuning of LLMs for downstream applications, and integration of instruction-tuned LLMs in natural language processing applications (e.g., machine translation, virtual assistants, retrieval-augmented generation systems, processing of spoken language, summarisation, etc.). | Tildeは、デジタル時代における言語の多様性を促進することを使命とする、欧州を代表する言語技術イノベーターかつサービスプロバイダーである。Tildeはリガ、ヴィリニュス、タリンの3拠点に150名以上の従業員を擁する。研究チームは9名の博士号取得者と研究員で構成され、260本以上の学術論文を発表している。長年にわたり、TildeはEU主要研究機関・大学との広範な研究開発パートナーシップを構築し、バルト地域の言語技術研究拠点として機能している。Tildeの最近の研究開発活動は、基盤となる大規模言語モデル(LLM)、下流アプリケーション向けLLMの微調整、および自然言語処理アプリケーション(機械翻訳、仮想アシスタント、検索拡張生成システム、音声言語処理、要約など)における指示調整済みLLMの統合に焦点を当てている。 |

Comments