Accueil Accueil    Envoyer Envoyer    Imprimer Imprimer

SCRIBO, projet de logiciel libre pour le traitement sémantique de l'information multimédia, financé à l'issue du 5ème appel à projets des pôles de compétitivité

La Direction Générale des Entreprises (Ministère de l'économie, des finances et de l'emploi) a annoncé vendredi 7 mars le financement par l'Etat et les collectivités territoriales franciliennes du projet coopératif de recherche industrielle SCRIBO dans le cadre du 5ème appel à projets lancé par le fonds de compétitivité des entreprises (FCE). Ce projet avait été labellisé en novembre 2007 par le pôle de compétitivité System@tic dans le cadre de sa thématique "Logiciel Libre".



SCRIBO - Semi-automatic and Collaborative Retrieval of Information Based on Ontologies - a pour objectif la mise au point d'algorithmes et d'outils collaboratifs pour l'annotation semi-automatique de documents numériques. Le budget total du projet est de 4.3 Meuros, pour une aide publique de 2 Meuros répartie entre les 9 acteurs du projet: l'AFP, le CEA LIST, l'INRIA, le LRDE (Epita), Mandriva, Nuxeo, Proxem, Tagmatica et XWiki (coordinateur).

Pour Stefane Fermigier, PDG de Nuxeo: "Grâce à SCRIBO, les éditeurs de logiciels et les intégrateurs qui travaillent dans le domaine de la gestion documentaire collaborative ou de la gestion des connaissances vont pouvoir disposer d'un ensemble de briques logicielles et d'un framework open source leur permettant de mettre à disposition de leurs utilisateurs des fonctions avancées de traitement de l'information, renforçant ainsi leur compétitivité et celle des organisations utilisatrices."

Pour Arnaud Laprévote, directeur des projets de recherche de Mandriva : "Avec SCRIBO, jamais la recherche d'informations dans la documentation informatique n'aura atteint une telle simplicité. SCRIBO va permettre à l'aide en ligne pour les distributions Linux d'entrer dans une nouvelle ère. La recherche, la navigation et l'utilisation des documentations vont être transformées et mettre Mandriva Linux encore plus à la portée de tous."

Pour Stéphane Laurière, directeur des projets de recherche XWiki et coordinateur SCRIBO: "SCRIBO s'inscrit dans les technologies du Web 3.0, c'est-à-dire le Web multimédia sémantique massivement participatif. Le couplage au sein d'un wiki de capacités d'annotation manuelle d'une part et automatique d'autre part ouvre des perspectives inédites dans la création collective de connaissances, leur indexation et leur transmission. La disponibilité sous licence libre des ateliers et standards qui seront produits par le consortium SCRIBO laisse espérer des retombées économiques, sociales et culturelles dépassant largement le seul cercle des partenaires. Des collaborations internationales avec d'autres projets sont par ailleurs prévues."

Participants au projet

Le projet SCRIBO réunit :
- des laboratoires spécialisés dans l'analyse de documents textuels et graphiques et dans l'extraction de connaissances : l'équipe ALPAGE de l'INRIA et de Université Paris 7, le Laboratoire de Recherche et de Développement de l'EPITA, le Laboratoire d'ingénierie de la connaissance du CEA-LIST;
- des PME éditrices d'outils dans le domaine de la gestion de contenus: Nuxeo, spécialisé dans la gestion de contenus pour entreprises (ECM); XWiki, éditeur des solutions collaboratives Web 2.0; Proxem, éditeur de solutions de traitement sémantique du langage naturel; Tagmatica, spécialisé dans l'analyse syntaxique et la normalisation ISO;
- des entreprises utilisatrices pilotes: l'Agence France-Presse et Mandriva.

Retombées
Les composants réalisés seront intégrés dans les suites logicielles respectives des éditeurs Nuxeo, Proxem et XWiki. L'atelier de traitement sera mis en oeuvre et évalué dans le contexte de deux cas d'utilisation:

l'AFP, qui utilise déjà les outils Nuxeo et XWiki, expérimentera les composants SCRIBO dans le contexte de l'annotation semi-automatique de flux d'informations multimédia multilingues, aussi bien dans des domaines généraux que thématiques ainsi que dans un contexte de veille;
Mandriva, déjà utilisatrice d'XWiki pour une de ses plateformes communautaires, mettra en oeuvre les composants SCRIBO d'une part pour procéder à l'annotation automatique de la documentation du système d'exploitation Mandriva Linux (manuels techniques, questions-réponses, articles de presse, interviews, etc.) dans le but d'améliorer l'accès à des informations spécifiques dans différentes langues (Mandriva est utilisée dans plus de 80 pays et comporte des communautés multilingues de plusieurs dizaines de milliers d'utilisateurs), d'autre part pour enrichir les fonctionnalités du bureau sémantique KDE.

Les marchés visés par SCRIBO sont multiples: veille intelligente dans des domaines généraux ou spécialisés (presse, défense, données sismiques, technologies spécifiques, etc.), analyse et routage de documents entrants (courriers, mails etc.), poste de travail sémantique.

L'ensemble des développements effectués dans le cadre du projet sera disponible sous licence libre compatible LGPL. SCRIBO apportera un avantage concurrentiel important aux PME impliquées en même temps qu'il permettra à ses participants de nouer un partenariat recherche-industrie susceptible d'avoir des retombées bien au-delà de la durée du projet et de ses seuls acteurs.

A propos de...

Nuxeo
La société Nuxeo se consacre au développement et au support de la plateforme Nuxeo, logiciel de gestion de contenu d'entreprises fondé sur les technologies Java EE 5 et la vision d'un « ERP du document ». La société développe et met en oeuvre son logiciel selon le modèle open source, sans coût de licence et sur le principe de souscription dépendant des déploiements et non du nombre d'utilisateurs. Présente sur ce marché depuis 2001, Nuxeo a fourni des solutions globales d'ECM à de nombreuses grandes entreprises, ce qui en fait le pionnier et le leader de la révolution de l'ECM open source. Son siège social se situe à Paris, avec des filiales au Royaume-Uni et en Roumanie. Nuxeo travaille en collaboration avec un réseau de partenaires intégrateurs tels qu'Atos Origin, Business & Decision, Capgemini, Eurocis, LogicaCMG/Unilog et bien d'autres, fournissant ainsi aux utilisateurs une large gamme de services professionnels comprenant notamment support, conseil, développement, formation et certification.
www.nuxeo.com

L'équipe ALPAGE (INRIA / Université Paris 7)
ALPAGE est une équipe mixte entre l'INRIA (centre de recherches de Paris-Rocquencourt) et l'Université Paris 7 (UFR de linguistique). L'équipe a pour objectif premier le développement et la mise en oeuvre de technologies pour l'analyse automatique de textes en français. Ceci passe par une meilleure compréhension et une meilleure formalisation des phénomènes linguistiques, y compris les plus complexes, puis leur prise en compte dans des modèles lexicaux et grammaticaux. Ces modèles doivent alors être mis en oeuvre à l'aide de technologies algorithmiques et logicielles avancées, à la fois symboliques et probabilistes. Ces travaux prennent tous leur sens dans le cadre d'applications concrètes. ALPAGE se concentre ainsi sur la construction d'outils de recherche d'informations linguistiques et extra-linguistiques, mais aussi de fouille de textes et de correction orthographique, grammaticale et stylistique.

Le Laboratoire de Recherche et de Développement de l'EPITA (LRDE)
Le LRDE a été créé en février 1998 pour promouvoir l'activité de recherche à l'École Pour l'Informatique les Techniques Avancées (EPITA). La politique du LRDE comprend deux grands axes: d'une part une activité de recherche propre à l'école sur ses sujets de prédilection, avec un objectif de reconnaissance scientifique grâce à des publications et des collaborations avec d'autres centres de recherche ; d'autre part, une activité de recherche appliquée, en collaboration avec des industriels afin de valoriser la recherche conduite en interne et de permettre un auto-financement de la recherche.

Le LRDE développe une bibliothèque générique et performante de traitements d'images, Olena. Ce projet a pour objet la réalisation d'une plate-forme de calcul numérique scientifique dédiée au traitement d'images, à la reconnaissance des formes et à la vision par ordinateur. Cet environnement est composé d'une bibliothèque générique hautes performances, d'un ensemble d'utilitaires pour scripts shell, ainsi que, à terme, d'un environnement interprété à la façon de MatLab ou Mathematica et d'un environnement de programmation visuel. Enfin, le LRDE a travaillé pendant 6 ans sur le sujet de la dématérialisation de documents papier dans le cadre d'un accord de partenariat avec un acteur industriel majeur du domaine.

Agence France-Presse (AFP)
L'AFP est une agence de presse mondiale fournissant une information rapide, vérifiée et complète sur les événements qui font l'actualité internationale, des guerres et conflits à la politique, au sport, au spectacle jusqu'aux grands développements en matière de santé, de sciences ou de technologie. Ses 2.900 collaborateurs répartis dans 165 pays rendent compte en six langues de la marche de la planète, 24 heures sur 24, en vidéo, texte, photo, multimédia et infographie.
www.afp.com

Mandriva
Mandriva, anciennement Mandrakesoft, édite le système d'exploitation Mandriva Linux, un des systèmes Linux les plus complets, les plus simples à utiliser et les plus populaires à travers le monde. Ayant à coeur de fournir des solutions open source accessibles à tous, Mandriva Linux est au centre d'une gamme de produits et services destinés non seulement aux entreprises mais également aux administrations et particuliers. Les produits de Mandriva sont disponibles en ligne dans près de 80 langues et dans plus de 140 pays par le biais de canaux de distribution dédiés. Basée à Paris, la société est inscrite au Marche Libre d'Euronext Paris.
www.mandriva.com

Tagmatica
Tagmatica est une société spécialisée dans le traitement automatique du langage. L'activité de Tagmatica comporte deux axes :
La rédaction de spécifications techniques. Gil Francopoulo (de Tagmatica) est l'un des deux auteurs de la norme ISO des dictionnaires pour le traitement automatique (Lexical Markup Framework).
Le développement de l'analyseur syntaxique TagParser pour le français et l'anglais. TagParser est un analyseur robuste et opérationnel principalement utilisé dans l'extraction d'information dans des corpus textuels de dizaines de millions de mots.
www.tagmatica.com

Le Laboratoire d'intégration des systèmes et des technologies du Commissariat à l'Energie Atomique (CEA LIST)
Acteur majeur en matière de recherche, de développement et d'innovation, le Commissariat à l'Energie Atomique intervient dans trois grands domaines : l'énergie, les technologies pour l'information et la santé, la défense et la sécurité ; en s'appuyant sur une recherche fondamentale d'excellence. Fort de ses 15000 chercheurs et collaborateurs, le CEA constitue une force d'expertise et de proposition pour les pouvoirs publics. Le CEA, moteur de l'innovation, contribue aux succès des industriels français et européens au travers des programmes de partenariat et de transfert de technologie.

Le CEA LIST, qui mène des recherches en ingénierie de la connaissance multimédia multilingue, développe depuis plusieurs années des technologies pour la recherche d'information et l'extraction de connaissances qui reposent sur une plateforme d'analyse d'images et d'analyse linguistique capable de traiter des langues aussi diverses que les langues romanes, germaniques, sémitiques ou asiatiques.
www-list.cea.fr

Proxem
Proxem ("Procédures sémantiques") est une jeune entreprise innovante, éditrice de logiciels de Traitement Automatique du Langage. Sa mission est d'aider les organisations à intégrer ces technologies dans leur Système d'Information, avec une gamme logicielle épaulée par une offre de conseil.
Proxem édite notamment le framework Antelope, un analyseur sémantique de textes, doté de capacités linguistiques. Ses applications concrètes sont nombreuses :
Réconciliation des données non-structurées et structurées des organisations,
Moteur de recherche sémantique (e-commerce, encyclopédies, intranets, sites web),
Outils de veille économique (analyse de news, recherche ciblée d'information, analyse des sentiments exprimés sur des blogs),
Applications de type Web sémantique.
www.proxem.com

XWiki
XWiki étend à l'ensemble du système d'information de l'entreprise la métaphore du wiki, c'est-à-dire la facilité à créer des objets numériques à plusieurs et à les relier les uns aux autres (textes, documents métiers semi-structurés, applications). XWiki décloisonne les applicatifs d'entreprise et amplifie l'intelligence collective du réseau de collaborateurs. La gamme de solutions XWiki Collaboration Suite est disponible sous licence libre LGPL et place XWiki parmi les leaders mondiaux du wiki d'entreprise. Les principaux axes de R&D XWiki en 2008-2009 sont le Web collaboratif, le Web sémantique, l'ingénierie du document électronique, les architectures pair-à-pair, les technologies de mobilité, le traitement automatique du langage, les interfaces graphiques et les architectures logicielles en général. XWiki a son siège à Paris et est également implantée en Roumanie et aux Etats-Unis. EADS, Total, Orange, Aélia (Groupe Lagardère) ou encore NEC font partie des centaines de sociétés utilisatrices de la technologie XWiki à travers le monde.
www.xwiki.com

www.scribo.ws

Jeudi 03 Avril 2008


Commentaires sur cet article

Nouveau commentaire :

Nom*
Adresse email* (non publiée)
Site web

Commentaire
B i u  QUOTE  URL
Me notifier l'arrivée de nouveaux commentaires
Les commentaires des articles sont édités sous la responsabilité exclusive de leurs auteurs. BPM-channel n'assume aucune responsabilité sur eux. Les commentaires sont édités immédiatement, seulement notre rédaction se réserve le droit de supprimer n'importe quel commentaire.
----------------------------------------------------
Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article.
Si vous souhaitez poser une question au rédacteur de l'article, contactez-le directement.
Merci.




Ci-dessous les derniers articles de cette rubrique (pour découvrir plus d'articles cliquez sur la rubrique dans la barre de menu)