Sarashina2-8x70Bの公開

概要 SB IntuitionsのSeng Pei Liew、李凌寒、高瀬翔です。弊社では日本語能力に主眼を置いた大規模言語モデルの構築に取り組んでおり、パラメータの大規模化のための施策として、学習済みの70Bパラメータ*1をMixture-of-Experts（MoE）モデルに拡張し、事…

2024-11-12

LLMの盗用を守るフィンガープリンティング

はじめに東京科学大学情報理工学院修士1年の山辺翔二郎と申します。2024年8月19日より、SB Intuitions株式会社 R&D本部 Responsible AIチームにてインターンシップを経験させていただきました。本記事では、インターンシップ中に取り組んだ研究テーマであ…

2024-10-24

SIGDIAL2024の参加報告

こんにちは、SB Intuitions株式会社の高山隼矢, 大萩雅也, 山崎天, 泉健太, Liu Lianboです。9月18-20日に京都で開催された、対話システム・談話研究に関する代表的な国際会議であるSIGDIAL2024にゴールドスポンサーとして協賛・参加いたしました。本記事で…

2024-10-18

多肢選択形式のVLMベンチマーク

VLM Internship

はじめに慶應義塾大学理工学研究科修士1年の今井悠人と申します。この度、SB Intuitions株式会社 R&D本部 Foundation dev部 VLMコア構築チームにインターンシップとして参加させていただきました。今回のインターンシップでは、既存のVLM (Vision-Language…

2024-10-07

Interspeech 2024の参加報告

こんにちは、SB Intuitions株式会社の大萩雅也と吉川克正です。9月1-5日にギリシャのコス島にて開かれた音声系では最大規模の国際会議の一つであるInterspeech 2024に参加し発表を行いました。本記事では発表の内容、また国際会議の様子について紹介してい…

2024-09-17

ACL 2024の参加報告

こんにちは、SB Intuitions株式会社の大萩雅也です。8月11-15日にバンコクにて開かれたNLPでは最大規模の国際会議の一つであるACL 2024(The 62nd Annual Meeting of the Association for Computational Linguistics)に参加しワークショップでの発表を行いま…

2024-08-21

日本語性能トップクラスの LLM・Sarashina2-70B の公開

LLM

SB Intuitionsの李凌寒、高瀬翔です。日本語に強い大規模言語モデル（LLM）Sarashina2-70Bを公開しました。国内でフルスクラッチで学習をしたLLMの中では、大規模な70Bパラメータを持ち、日本語性能もトップクラス、かつオープンな MIT ライセンスで公開さ…

2024-07-26

Sarashina の性能評価

LLM Evaluation

SB Intuitions の岡照晃、李凌寒、水本智也、柴田知秀です。本記事では Sarashina の性能評価について解説します。 Sarashina は SB Intuitions で開発している日本語の大規模言語モデル（Large Language Model; LLM）です。 LLM の学習は一般に事前…

2024-07-11

第260回自然言語処理研究発表会 (NL研)の参加報告

Conference

こんにちは、SB Intuitions株式会社の大萩雅也、水本智也、高山隼矢です。6月29日、30日に金沢にて開かれた第260回自然言語処理研究発表会 (NL研)にて発表を行いました。本記事では発表の内容、また発表会の様子について紹介していきます。目次目次発表…

2024-07-10

INTERSPEECH 2024に論文が採択されました

Publications

以下の論文がINTERSPEECH 2024に採択されました。 Investigation of look-ahead techniques to improve response time in spoken dialogue system Masaya Ohagi, Tomoya Mizumoto, Katsumasa Yoshikawa 論文の概要本論文では大規模言語モデルを用いた音声対…