Naoaki Okazaki (@chokkanorg) Twitter Tweets • TwiCopy

Naoaki Okazaki

@chokkanorg

3 months ago

Gemma-2-Llama SwallowがGoogle DeepMind社のGemmaverse（Gemma活用の事例集）で紹介されました。 deepmind.google/models/gemma/g…

thumb_up_off_alt44

chat_bubble_outline3

repeat10

shareShare

Kazuki Fujii

@okoge_kaz

3 months ago

Llama-3.3-Swallow-70Bの学習にAWS Sagemaker HyperPodを利用させていただいた件がAWS公式のTechBlogになりました！ AWS Summit Japanでこちらについて、より詳しくお話しさせていただきます。 aws.amazon.com/jp/blogs/machi…

thumb_up_off_alt77

chat_bubble_outline3

repeat11

shareShare

LLM勉強会（LLM-jp）

@llm_jp

3 months ago

様々な日本語LLMと会話し評価できるプラットフォーム「LLM-jp Chatbot Arena」を公開しました。 chatbot-arena.apps.llmc.nii.ac.jp 現在、LLM-jp のフラグシップモデル「LLM-jp-3.1 8x13B」を含む、計7モデルが稼働中です。どうぞご利用ください。

thumb_up_off_alt49

chat_bubble_outline1

repeat14

shareShare

Kazuki Fujii

@okoge_kaz

2 months ago

明日 6/25 12:40- Swallow LLMの研究開発についてお話させていただきます！SageMaker HyperPodの利用事例を中心に話しますのでぜひ！ (6/25は、夕方まで現地にいます) #AWSSummit

thumb_up_off_alt39

chat_bubble_outline0

repeat13

shareShare

Llama 3.1 Swallow 8B v0.5を公開しました。Llama 3.3 Swallow 70BやGemma-2-Llama Swallowのレシピをさらに改良し、性能を向上させました。学習環境としてAWSのSageMaker HyperPod (H200) を利用しました。人気の8Bモデルの改良版を是非お試しください。 swallow-llm.github.io/llama3.1-swall…

thumb_up_off_alt95

chat_bubble_outline2

repeat39

shareShare

Kazuki Fujii

@okoge_kaz

2 months ago

独自開発したデータセットSwallowCode, SwallowMathを採用し、数学とコード能力を強化しました。ブログも書いていますので、併せてどうぞ！ zenn.dev/tokyotech_lm/a… 本日のAWS Summitにて、こちらのモデルについてもお話しさせていただきます！

thumb_up_off_alt63

chat_bubble_outline0

repeat17

shareShare

Youmi Ma

@youmima1015

2 months ago

Llama 3.1 Swallow 8B Instruct v0.5の指示チューニングに用いた対話データセットGemma-3-lmsys-chat-1m-synthを公開しました！今回は新メンバー Luke🐈 が中心となって作成してくれました🙌 ライセンスをよく読んだ上でご活用ください〜 huggingface.co/datasets/tokyo…

thumb_up_off_alt26

chat_bubble_outline0

repeat10

shareShare

Naoaki Okazaki

@chokkanorg

2 months ago

Swallow LLM Leaderboardを更新しました。Llama 3.1 Swallow 8B v0.5, Llama 4 Scout, llm-jp-3-*-instruct3, llm-jp-3.1-*-instruct4, Qwen2.5-32B, Qwen3-*-Baseを追加しました。この評価ではLlama 4 Scout InstructよりもLlama 3.3 70B Instructの方が高性能でした。 swallow-llm.github.io/leaderboard/

thumb_up_off_alt61

chat_bubble_outline0

repeat21

shareShare

Yuki Arase (荒瀬由紀)

@yuki_arase

2 months ago

情報処理学会フェローに認定いただきました🏅 ご推薦いただいた先生方、お世話になっておりますみなさま、本当にありがとうございます。引き続き精進します💪 isct.ac.jp/ja/news/rm9ggw…

thumb_up_off_alt118

chat_bubble_outline2

repeat9

shareShare

Kazuki Fujii

@okoge_kaz

2 months ago

本日のNLPコロキウムにご参加いただいた方々、ありがとうございました！ LLM開発における現場レベルの細かな話をさせていただきました。スライドも公開させていただきましたので、よろしければご覧ください。 speakerdeck.com/fujiikazuki200…

thumb_up_off_alt109

chat_bubble_outline0

repeat27

shareShare

Youmi Ma

@youmima1015

a month ago

I’m at #ACL2025NLP to present our work on membership inference attack with Masahiro Kaneko , Yuki Wata and Naoaki Okazaki: 📄aclanthology.org/2025.findings-… 📍Hall 4/5, 16:00-17:30, July 29(Tues.) Looking forward to discussing with you!

thumb_up_off_alt20

chat_bubble_outline1

repeat4

shareShare

Kazuki Fujii

@okoge_kaz

a month ago

データセットの良し悪しをLLMを学習することなく判別するための手法についてです。結果的に検証した手法は採用する水準にないことが判明しましたが知見として執筆させていただきました。

thumb_up_off_alt22

chat_bubble_outline0

repeat5

shareShare

Sam Altman

@sama

a month ago

gpt-oss is out! we made an open model that performs at the level of o4-mini and runs on a high-end laptop (WTF!!) (and a smaller one that runs on a phone). super proud of the team; big triumph of technology.

thumb_up_off_alt41,41K

chat_bubble_outline1,1K

repeat3,3K

shareShare

Naoaki Okazaki

@chokkanorg

17 days ago

日本語・英語の大規模言語モデルを高難易度ベンチマークで評価したリーダーボード Swallow LLM Leaderboard v2 を公開しました。GPT-5, o3, o3-mini, gpt-oss, Qwen3 など、最先端のLLMの評価結果をご覧いただけます。サイト: swallow-llm.github.io/swallow-leader…

thumb_up_off_alt102

chat_bubble_outline0

repeat22

shareShare

Naoaki Okazaki

@chokkanorg

17 days ago

Swallow LLM Leaderboard v2の日本語5タスクの平均では、GPT-5が最も高いスコアを記録しました。オープンなモデルでは、Qwen3-235B-A22B-Thinking-2507、Qwen3-235B-A22B-Instruct-2507、gpt-oss-120bなどがクローズドなモデルと遜色のない性能を示しています。棒グラフ: swallow-llm.github.io/leaderboard/in…

thumb_up_off_alt98

chat_bubble_outline0

repeat32

shareShare

Naoaki Okazaki

@chokkanorg

17 days ago

Swallow LLM Leaderboard v2の日本語6タスクの評価では、GPT-5の性能の高さが際立っており、さらに高難易度なベンチマークの整備が必要です。オープンモデルであるQwen3-235B-A22B-Thinking-2507やgpt-oss-120bも隙がなく、規模に見合った性能でした。レーダーチャート: swallow-llm.github.io/leaderboard/ra…

thumb_up_off_alt139

chat_bubble_outline0

repeat35

shareShare

Masahiro Kaneko

@masahirokaneko_

17 days ago

Two first-author long papers accepted to #EMNLP2025 main, and one co-authored long paper in Findings 🎉 Thanks Rem Hida, Alham Fikri Aji, Naoaki Okazaki, and Tim Baldwin! All on arXiv📜 - arxiv.org/abs/2502.11495 - arxiv.org/abs/2407.03129 - arxiv.org/abs/2403.16139

Two first-author long papers accepted to #EMNLP2025 main, and one co-authored long paper in Findings 🎉 Thanks <a href="/rem_h4_/">Rem Hida</a>, <a href="/AlhamFikri/">Alham Fikri Aji</a>, <a href="/chokkanorg/">Naoaki Okazaki</a>, and <a href="/eltimster/">Tim Baldwin</a>! All on arXiv📜
- arxiv.org/abs/2502.11495
- arxiv.org/abs/2407.03129
- arxiv.org/abs/2403.16139

thumb_up_off_alt84

chat_bubble_outline1

repeat10

shareShare

Kazuki Fujii

@okoge_kaz

11 days ago

AWS AI Frontier Meetupにて Swallow Projectでの開発に関して発表を行いました！！ speakerdeck.com/fujiikazuki200…

thumb_up_off_alt76

chat_bubble_outline0

repeat12

shareShare

Naoaki Okazaki

Naoaki Okazaki

Kazuki Fujii

LLM勉強会（LLM-jp）

Kazuki Fujii

Naoaki Okazaki

Kazuki Fujii

Youmi Ma

Naoaki Okazaki

Yuki Arase (荒瀬 由紀)

Kazuki Fujii

Youmi Ma

Kazuki Fujii

Sam Altman

Naoaki Okazaki

Naoaki Okazaki

Naoaki Okazaki

Masahiro Kaneko

Kazuki Fujii

Yuki Arase (荒瀬由紀)