Christophe Cerisara (@ccerisara) 's Twitter Profile
Christophe Cerisara

@ccerisara

CNRS researcher in computer science, speech recognition and natural language processing

ID: 552544802

calendar_today13-04-2012 08:59:50

308 Tweet

123 Followers

392 Following

Jacob Eisenstein (@jacobeisenstein) 's Twitter Profile Photo

Curious about co2 emissions associated with conference travel? Roy Schwartz and i ran the numbers! (just in time for #EMNLP2023 and #NeurIPS2023) gist.github.com/jacobeisenstei…

Alexander Doria (@dorialexander) 's Twitter Profile Photo

With Benoît de Courson and Benjamin Azoulay from Gallicagram we are releasing on Hugging Face what is probably the largest open corpus in French: 85 billon words in the public domain. huggingface.co/datasets/PleIA… huggingface.co/datasets/PleIA…

Stéphane Bortzmeyer (@bortzmeyer) 's Twitter Profile Photo

Comme disait la CNIL : il faut utiliser Microsoft Azure pour les données de santé, il n'y a pas d'hébergeur européen sérieux en sécurité techreport.com/news/microsoft…

Alexander Doria (@dorialexander) 's Twitter Profile Photo

Announcing today in @Wired the release of Common Corpus, the largest collection of fully open corpus on HuggingFace: nearly 500b words (600-700b tokens) in public domain. wired.com/story/proof-yo…

Nando de Freitas (@nandodf) 's Twitter Profile Photo

There appears to be a mismatch between publishing criteria in AI conferences and "what actually works". It is easy to publish new mathematical constructs (e.g. new models, new layers, new modules, new losses), but as Apple's MM1 paper concludes: 1. Encoder Lesson: Image

There appears to be a mismatch between publishing criteria in AI conferences and "what actually works". It is easy to publish new mathematical constructs (e.g. new models, new layers, new modules, new losses), but as Apple's MM1 paper concludes:

1. Encoder Lesson: Image
Thomas Wolf (@thom_wolf) 's Twitter Profile Photo

[75min talk] i finally recorded this lecture I gave two weeks ago because people kept asking me for a video so here it is, enjoy "The Little guide to building Large Language Models in 2024" tried to keep it short and comprehensive – focusing on concepts that are crucial for

[75min talk] i finally recorded this lecture I gave two weeks ago because people kept asking me for a video

so here it is, enjoy "The Little guide to building Large Language Models in 2024"

tried to keep it short and comprehensive – focusing on concepts that are crucial for
Alexander Doria (@dorialexander) 's Twitter Profile Photo

Big announcement: pleias releases a massive open corpus of 2 million Youtube videos in Creative Commons (CC-By) on Hugging Face. Youtube-Commons features 30 billion words of audio transcriptions in multiple languages, and soon other modalities huggingface.co/datasets/PleIA…

Big announcement: <a href="/pleiasfr/">pleias</a> releases a massive open corpus of 2 million Youtube videos in Creative Commons (CC-By) on <a href="/huggingface/">Hugging Face</a>. Youtube-Commons features 30 billion words of audio transcriptions in multiple languages, and soon other modalities huggingface.co/datasets/PleIA…
Emile Marzolf (@emile_marzolf) 's Twitter Profile Photo

🤖Je vois que l’IA générative “Albert” de l’Etat fait beaucoup parler, intéresse et est aussi critiquée/moquée. On retrace la genèse de ce projet, aujourd’hui testé à petite échelle auprès d’une soixantaine de conseillers des maisons France Services ⤵️

Alexander Doria (@dorialexander) 's Twitter Profile Photo

Il y a 10 ans, nous avions fait fuiter l'accord de licence nationale avec Elsevier avec Rayna ¯\_(ツ)_/¯ 😷🤓🧬🇪🇺👩‍💻📚✍️ dans Rue89. Depuis la science ouverte a énormément avancé (le plan S, mandat sur HAL, baromètre du MESRI), et on verse toujours des millions à Elsevier.

Il y a 10 ans, nous avions fait fuiter l'accord de licence nationale avec Elsevier avec <a href="/MaliciaRogue/">Rayna ¯\_(ツ)_/¯ 😷🤓🧬🇪🇺👩‍💻📚✍️</a> dans Rue89. Depuis la science ouverte a énormément avancé (le plan S, mandat sur HAL, baromètre du MESRI), et on verse toujours des millions à Elsevier.
hubert guillaud (@hubertguillaud) 's Twitter Profile Photo

La question de la souveraineté technologique est souvent mal posée. En Europe et en France particulièrement, l'opinion commune veut que la réglementation européenne soit la cause de tous nos problèmes et notamment que nous n'ayons pas de grandes entreprises de la tech. 1/10

yobibyte (@y0b1byte) 's Twitter Profile Photo

New blog! Notebooks are McDonalds of Code. You can come to McDonalds and order a salad, but you won't. Same with notebooks, you can write NASA-production-grade software in a notebook, but most likely you won't. Notebooks make you lazy, and encourage bad practices. **common

New blog! Notebooks are McDonalds of Code.

You can come to McDonalds and order a salad, but you won't. Same with  notebooks, you can write NASA-production-grade software in a notebook,  but most likely you won't.   Notebooks make you lazy, and encourage bad practices.

**common
Stéphane Bortzmeyer (@bortzmeyer) 's Twitter Profile Photo

L'Internet des Objets, c'est quand on ne peut plus allumer la lumière car le contrôleur a les résolveurs #DNS d'#OpenDNS en dur et qu'on ne peut pas les changer : x.com/seheyah/status…

maxime amblard (@maximeamblard) 's Twitter Profile Photo

Vous entrez en L3 et vous voulez faire de #IA, du #nlp, des #llm bref vous préparer à entrer dans le master international de TAL à l’IDMC ! Nous avons encore des places ouvertes pour la rentrée.

Brice Le Borgne (@briceleborgne) 's Twitter Profile Photo

Ce sont des données passionnantes que le ministère refuse de publier. Obtenues par franceinfo, les dotations horaires des établissements révèlent de fortes inégalités : les lycées privés sont souvent mieux dotés que ceux du public.

Ce sont des données passionnantes que le ministère refuse de publier. Obtenues par <a href="/franceinfo/">franceinfo</a>, les dotations horaires des établissements révèlent de fortes inégalités : les lycées privés sont souvent mieux dotés que ceux du public.
MT Group at FBK (@fbk_mt) 's Twitter Profile Photo

Now it's our Sara Papi presenting "Mosel: 950,000 Hours of Speech Data for Open-Source Speech Foundation Model Training on EU Languages" soon to be published at #EMNLP2024 #LT2024FBK

Now it's our <a href="/sarapapi/">Sara Papi</a> presenting "Mosel: 950,000 Hours of Speech Data for Open-Source Speech Foundation Model Training on EU Languages" soon to be published at #EMNLP2024 

#LT2024FBK
David Picard (@david_picard) 's Twitter Profile Photo

Avec le prix Nobel de physique pour l'apprentissage et les réseaux de neurones, il est clair qu'on est face à un changement majeur (type électricité, nucléaire, télécom). Il nous faut une politique nationale plus ambitieuse! Jean Zay est déjà trop petit! Genci Ministère Enseignement supérieur et Recherche