Présentation

L’Observatoire des textes, des idées et des corpus (ObTIC) est une équipe-projet du SCAI dédiée aux humanités numériques. Faisant suite à l’ancien LabEx OBVIL, l’ObTIC s’appuie sur une expertise acquise dans la production et l’édition des données, dans la conception et l’expérimentation des logiciels et des algorithmes pour les chercheurs en lettres et sciences humaines et sociales, et dans le développement de nouvelles méthodologies de recherche, fondées sur le numérique, au sein de ces disciplines.


Le caractère interdisciplinaire de notre équipe nous permet d’intervenir pleinement dans les différents domaines de recherche liés au champ international des humanités numériques. Avec des approches hybrides (méthodes d’IA et méthodes symboliques), nous proposons d’aborder les textes et les corpus à travers des concepts sémantiques transversaux qui ne dépendent pas d’un genre textuel en particulier. Cela nous ouvre des horizons pour l’analyse de textes dans d’autres domaines, comme les humanités médicales par exemple.

Axes de recherche et de formation

1 – Notre premier axe, consacré à l’édition numérique savante, présente des enjeux de génétique textuelle et de philologie. Il s’attache à repenser les pratiques de lecture à la lumière des nouvelles possibilités informatiques (par le biais d’une annotation précise des corpus en XML-TEI en particulier). Ce type d’édition peut établir des bases de données intéressantes quantitativement (par exemple la Très Grande Base compte 130 000 livres numérisés par la BnF) ou des bases qui croisent l’exigence de la philologie et la rigueur du numérique, mettant à disposition du lecteur les états textuels successifs et les manuscrits. Il bouleverse les pratiques éditoriales communes, en particulier l’annotation, et permet une redéfinition de la notion d’œuvre, en échappant en particulier aux partages génériques traditionnels. Une telle pratique éditoriale n’est plus individuelle, mais collective, et appelle à la création d’outils d’édition et d’annotation collectifs.
2 – Le deuxième axe touche à la fouille des données et à l’herméneutique des textes. La mise en interaction de différents corpus de nature parfois très distincte renforce une approche à la fois intertextuelle et interdisciplinaire : elle interroge directement l’évolution de nos pratiques de lecteurs et de chercheurs en exigeant des méthodes transversales de fouille. L’un de nos principaux objectifs est l’analyse sémantique des données, que ce soit par le développement d’outils et d’algorithmes ou par l’élaboration d’une modélisation sémantique des ontologies.

L’intérêt des chercheurs se porte en particulier sur l’analyse de l’énonciation subjective, des émotions et du vécu humain, par le biais de méthodes automatiques ou semi-automatiques. Or ces méthodes sont susceptibles de servir assez largement d’autres types d’analyse de discours, en s’adaptant à des corpus de natures très distinctes. L’ObTIC veillera particulièrement à questionner ces interactions nouvelles entre l’IA et l’humain en élaborant simultanément une nouvelle méthodologie et une nouvelle herméneutique. À travers cette démarche, il s’agit de développer des réflexions sur les évolutions de nos pratiques culturelles ainsi que sur la façon dont le numérique ouvre à de nouvelles approches interprétatives. Ces pratiques nous amèneront à repenser les méthodes traditionnelles de l’histoire intellectuelle, de l’histoire des sciences et de la philosophie, ainsi que tout le patrimoine des idées.
3 – Notre troisième axe, dévolu au développement d’applications d’analyse textuelle, ne se contente pas d’apporter des solutions aux besoins des  chercheurs en lettres et sciences humaines et sociales : il invite à une réflexion plus profonde sur la méthodologie à adopter, de façon à articuler constamment mesure et interprétation des données, qualitatif et quantitatif, calculs et lecture. Il encourage un positionnement critique et une réflexivité permanente sur les outils employés et sur les nouvelles pratiques disciplinaires – en littérature, en histoire, en musicologie, en histoire de l’art, en philosophie, en linguistique, en sociologie, etc. – ainsi que la mise en place d’une recherche résolument interdisciplinaire. Plus globalement, l’ObTIC accompagnera une réflexion épistémologique et critique sur les mutations culturelles induites par les nouvelles technologies informatiques.

4 – Enfin, par le biais de notre partenariat avec le BnF DataLab, l’ObTIC continuera ses activités de formation en humanités numériques auprès des masterants, doctorants, post-doctorants, chercheurs et enseignants-chercheurs en lettres et sciences humaines et sociales. Ces formations comprennent des enseignements de Master 1 et de Master 2 dispensés au sein de la Faculté des Lettres de Sorbonne Université : il s’agit de séminaires de recherche (Introduction aux humanités numériques et Méthodes et pratiques des Humanités numériques) et de cours de méthodologie (Humanités numériques pour la recherche littéraire). 

En outre, l’ObTIC offrira également des formations ponctuelles à la recherche en humanités numériques. Celles-ci prendront la forme d’ateliers numériques assurés par l’équipe d’ingénieurs, qui aborderont toute la chaîne de traitement textuelle nécessaire à la recherche en humanités numériques, de la numérisation des corpus à la fouille et la visualisation des données et de journées d’études à destination des doctorants et post-doctorants. Seront aussi organisés un cycle de conférences ouvertes au grand public, ainsi que des universités d’été (BnF/Sorbonne Université) et d’hiver (Sorbonne Université d’Abou Dhabi).
L’ObTIC est donc avant tout conçu comme un lieu d’échanges entre les spécialistes en humanités numériques, le traitement automatique des langues et IA, d’une part, et les chercheurs en lettres et sciences humaines et sociales d’autre part. Cette collaboration repose sur la conception de méthodes et d’outils numériques transversaux et s’accompagne d’une réflexion théorique et critique sur ces nouvelles pratiques d’édition, de lecture et d’analyse textuelle dans le domaine des humanités numériques.