Taiji Suzuki (@btreetaiji) 's Twitter Profile
Taiji Suzuki

@btreetaiji

統計科学・機械学習・数理工学を研究してます.

ID: 1603589724

linkhttp://ibis.t.u-tokyo.ac.jp/suzuki/ calendar_today18-07-2013 14:49:48

2,2K Tweet

8,8K Followers

235 Following

Jeff Dean (@jeffdean) 's Twitter Profile Photo

Very excited to see this agreement. I was able to tour Commonwealth Fusion Systems's facility in December last year and was excited by the potential! Working fusion energy could be game changing for the world.

Taiji Suzuki (@btreetaiji) 's Twitter Profile Photo

今回のNeurIPSの査読ルール,かなり効いている(査読を提出しない査読者には共著者にメールが行く&自分の論文の査読結果が見られなくなる).すべての論文で査読が揃っている.これまでにはあり得なかった現象.

ビーム | Seiya Tokui (@beam2d) 's Twitter Profile Photo

Our paper on metadata conditioning in LM pretraining arxiv.org/abs/2504.17562 is accepted to CoLM 2025! Huge thanks to all coauthors and reviewers!

Taiji Suzuki (@btreetaiji) 's Twitter Profile Photo

訓練時に文章の文頭にmeta-dataを挿入することで学習の効率がどのように変化するかを調べた研究がCOLM2025に採択されました.PFNの方々と共同研究させていただきました. arxiv.org/pdf/2504.17562

Taiji Suzuki (@btreetaiji) 's Twitter Profile Photo

D2の西川君による研究です. 通常のAttentionを線形Attentionに蒸留する際に,必要な次元を統計的自由度を用いて決定する手法を提案しています.各層の"複雑さ"を定量化することができて,次元を決め打ちするよりも効率的な近似が可能です.

Daisuke Okanohara / 岡野原 大輔 (@hillbig) 's Twitter Profile Photo

LLM訓練時にデータを説明するメタデータを挿入することで学習効率が変わるのかを調べた東大鈴木研とPFNの共同研究がCOLM 2025に採択されました。学習効率を改善する利点が大きいが、隠れた情報を推定する能力を学習する機会が失われ、後続タスクの条件次第でトレードオフがあることを示しました

Taiji Suzuki (@btreetaiji) 's Twitter Profile Photo

Mixture of Expertの学習ダイナミクスに関する研究がICML2025に採択されました.インターンの松谷君(当時B3!)と弊研究室M1の川田君主導の研究です. 単一ネットワークでは学習が難しい問題でも,ゲートネットも一緒に学習することで学習可能になることを示しています. x.gd/hDIW3

Ryota Tomioka (@ryotat) 's Twitter Profile Photo

BioEmu is now published in Science! 🎉 I’m deeply grateful to the incredible highly collaborative team that made this happen. Can't wait to see how the community uses BioEmu to better understand protein structure ensemble and their implilcations in biology and medicine.

Taiji Suzuki (@btreetaiji) 's Twitter Profile Photo

文脈内学習の状況にて,Transformerはsoftmax注意によって「テスト時に」特徴学習ができることを示しました.さらに,そのテスト時の学習複雑さは情報理論的下限に近いレートを達成し,「生成指数」と呼ばれる量で特徴づけられることを示しました.ICML2025で発表します. x.gd/WXBCy

文脈内学習の状況にて,Transformerはsoftmax注意によって「テスト時に」特徴学習ができることを示しました.さらに,そのテスト時の学習複雑さは情報理論的下限に近いレートを達成し,「生成指数」と呼ばれる量で特徴づけられることを示しました.ICML2025で発表します.
x.gd/WXBCy
Simon Shaolei Du (@simonshaoleidu) 's Twitter Profile Photo

Can transformers analyze code efficiently? ✅ Yes. We prove transformers efficiently handle real compiler tasks (AST construction, symbol resolution, type infer) using only log size—while RNNs require linear size (in input length). Paper: arxiv.org/abs/2410.14706 #COLM2025

Taiji Suzuki (@btreetaiji) 's Twitter Profile Photo

Unfortunately, I cannot attend ICML this year. But, my students and collaborators will present our work in the main conference. Please stop by our posters!

Unfortunately, I cannot attend ICML this year.

But, my students and collaborators will present our work in the main conference. 
Please stop by our posters!
asap (@asap2650) 's Twitter Profile Photo

arxiv.org/abs/2507.10532 これが本当なら、残念ながらQwen系の強化学習論文の信憑性は完全に無くなってしまった。 つまみ食い程度しかAI系の論文を読んでない自分ですら、QwenがLlamaよりも強化学習で数学の能力が上がる結果を見たことあるから、多くの研究者がQwen使ってたんじゃないかな。残念

OpenAI (@openai) 's Twitter Profile Photo

ChatGPT can now do work for you using its own computer. Introducing ChatGPT agent—a unified agentic system combining Operator’s action-taking remote browser, deep research’s web synthesis, and ChatGPT’s conversational strengths.

Taiji Suzuki (@btreetaiji) 's Twitter Profile Photo

少し遅いアナウンスですが,日本評論社から出版中の「数学とAIのこれまで(とこれから)」に以前執筆した記事「生成AIの数理」+後日談が掲載されています. その他の豪華な先生方の記事も大変勉強になります.

少し遅いアナウンスですが,日本評論社から出版中の「数学とAIのこれまで(とこれから)」に以前執筆した記事「生成AIの数理」+後日談が掲載されています.

その他の豪華な先生方の記事も大変勉強になります.
Chen-Yu Lee (@chl260) 's Twitter Profile Photo

Thrilled to introduce "𝗗𝗲𝗲𝗽 𝗥𝗲𝘀𝗲𝗮𝗿𝗰𝗵𝗲𝗿 𝘄𝗶𝘁𝗵 𝗧𝗲𝘀𝘁-𝗧𝗶𝗺𝗲 𝗗𝗶𝗳𝗳𝘂𝘀𝗶𝗼𝗻," a new deep research agent designed to mimic the iterative nature of human research, complete with cycles of planning, drafting, and revision. 🚀🚀 arxiv.org/pdf/2507.16075

Thrilled to introduce "𝗗𝗲𝗲𝗽 𝗥𝗲𝘀𝗲𝗮𝗿𝗰𝗵𝗲𝗿 𝘄𝗶𝘁𝗵 𝗧𝗲𝘀𝘁-𝗧𝗶𝗺𝗲 𝗗𝗶𝗳𝗳𝘂𝘀𝗶𝗼𝗻," a new deep research agent designed to mimic the iterative nature of human research, complete with cycles of planning, drafting, and revision. 🚀🚀

arxiv.org/pdf/2507.16075