乐天集团开放日语大模型Rakuten AI 3.0,被曝基于DeepSeek V3架构而引发争议
okx 3月17日消息,乐天集团宣布开始提供日语特化大模型 Rakuten AI 3.0。公司称该模型在日本文化与历史、指令遵循等多项日语基准上,表现高于 gpt-4o 等模型。其基于开源社区模型叠加自有双语数据等进行开发。但 X 上网友发现项目 Hugging Face 页面的 config.json 包含类似 model_type”: “deepseek_v3” 等内容。而该模型在回答相关问题时,其舆论立场明显更偏向中国而非日本。这引发了网友的关于该模型是否基于 DeepSeek 开发,以及其包含多少日本自主研发的技术的讨论。
