Pour découvrir la zone privée cliquez ici ou connectez vous via Login to facebook

La "débabélisation" d’Internet : pas si utopique que ça?


Marten van Valckenborch. credit photo: flickr.com/photos/imagem-mundo

En réaction à mon billet d’avant hier à propos du déclin du sentiment d’appartenance national  Thomas  Jestin, nouveau venu sur mikiane.com et auteur de http://appeldu18janvier2008.wordpress.com, a évoqué  une émission enregistrée par Public Sénat au cours de laquelle Jacques Attali parle d’un système qui pourrait devenir la nouvelle grande révolution d’Internet : je veux parler de la traduction automatique instantanée de textes…

Aujourd’hui « les Internet » français, anglais, espagnols, portugais, chinois, indiens, japonais, coréens…. sont globalement techniquement connectés  (la Chine l’est de plus en plus…). La dernière frontière entre internautes reste celle de la langue. Il est rare de trouver des français sur les réseaux sociaux coréens… Mais imaginez qu’un système permette des traductions instantanées de grande qualité, la barrière de la langue pourrait sauter et le village planétaire voire réellement le jour.

Qu’est ce qui limite aujourd’hui cette révolution ? Les moyens techniques : les services comme Google Translation, Reverso,  Traduction Voilà, Systran que nous connaissons ne sont pas de bonne qualité et ne peuvent pas prétendre, dans l’état, à rendre un service de traduction efficace à l’echelle de l’ensemble d’Internet.

Les problèmes principaux rencontrés dans les algoritmes de traduction de textes sont dûs à la complexité du contexte sémantique d’expression des interlocuteurs et à la taille des corpus de mots et de syntaxes connus par le système. Afin d’améliorer les traductions il est encore nécessaire de faire intervenir le cerveau humain. Mais on ne peut pas imaginer installer un traducteur-correcteur entre chaque interlocuteur… En revanche il est possible d’utiliser ces mêmes interlocuteurs pour réaliser les corrections. Prenons l’exemple d’une conversation via une page de commentaire sur un blog. Un chinois souhaite lire mikiane.com qui est écrit en français (c’est un exemple peu probable je vous l’accorde… :-)). Pour que la traduction soit compréhensible en cantonais, il faut lors de l’écriture du billet, prendre en compte les contraintes du système de traduction. Un logiciel qui s’installerait sur le traitement de texte pourrait indiquer au fur et à mesure de l'écriture de l'article le niveau de compréhension de celui ci par le traducteur automatique. En somme vous écrivez un mot inconnu ou utlisez une tournure de phrase ambigüe, le système le detecte et vous l’affiche. Il vous pose des questions et vous aide à lui parler « dans sa langue ». Simultanément, un système expert apprend "votre langue" au traducteur automatique en constituant un corpus de mot et d’expressions personnels. Le lecteur chinois pourrait à son tour utiliser le même système lorsqu’il souhaite poster un commentaire : une machine semi-automatique de traduction universelle et le début de la fin des frontières linguistiques sur le net.

Mais il y a une faille dans l'exposé. Quand j’évoque un système expert qui permettrait d’enrichir les corpus de mot et d’expressions afin d’intégrer les variations de la langue des interlocuteurs, il manque un élément dans la chaine. Qui apprend à la machine à traduire les corpus de mots et les expressions personnels? C’est là qu’intervient le réseau : un Wikipedia de la traduction! Des centaines de mots, d’expressions, de textes, livrés aux contributeurs internautes polyglotes prêts à donner de leur temps pour enrichir la machine. La puissance de la participation au profit de la "débabélisation" de l’internet….

Pour info Microsoft a déjà déposé en 2007 un brevet pour un système de traduction automatique pour messagerie intantanée.

Portrait de Raphael Labbé

Bon j'avais ecris un long

Bon j'avais ecris un long commentaire pour te dire que grosso modo everything was already there.

2 choses :

G talk = http://googletalk.blogspot.com/2007/12/merry-christmas-god-jul-and.html

Google Book = la littérature ! "Des centaines de mots, d’expressions, de textes, livrés aux contributeurs internautes polyglotes prêts à donner de leur temps pour enrichir la machine."

Allez zou le réel nous a deja rattrapé cher ami.

Portrait de Michel Levy-Provencal

t trop bon mec.... Je savais

t trop bon mec....

Je savais que t'allais nous trouver LE truc qui implementait le concept! 

Poster un nouveau commentaire

Le contenu de ce champ est gardé secret et ne sera pas montré publiquement.
CAPTCHA
Cette question vous est posée pour détecter si vous êtes humain ou machine (curieux non?)
Image CAPTCHA
Copy the characters (respecting upper/lower case) from the image.

Le TGI de Bonneville met en ligne des "contenus pirates" !!!

Quelle surprise ce matin en tombant sur cette alerte de Damien Guinet (blogitexpress) dans mon flux friendfeed, "Heu, il y a comme un problème sur ce site : http://www.tgi-bonneville.just...". En effet, le site du tribunal de grande instance de Bonneville affichait fièrement une page proposant en libre téléchargement une série de contenus pirates (des films et des jeux)! Voici une copie d'écran du site dimanche 5 janvier à 11h20... Rigolo non?

Social Media, Tech, Marketing : les conférences 2009 !

S'il n'y avait qu'un seul rendez-vous à ne pas manquer en 2009, ce serait évidemment la TED Conference (comme tous les ans)... Mais je n'y serais pas :-( , en revanche, voici une sélection des bons plans Marketing, Social Media et Tech de l'année 2009 aux US et dans le monde. De quoi faire une petite sélection personnelle. (mon Bestof : la DEMO à Palm Desert en Mars et la Web2.0 à NYC en septembre...).

Suivez des MoJos

Equipement en vrac d'un MoJo (Mobile Journalist) par natachaqs

Les journalistes contemporains sont des DJs et des MoJos (des journalistes mobiles). Ils publient sur Flickr, Youtube, Twitter, Friendfeed... via leurs terminaux mobiles et en direct depuis le terrain. Sur MediaOnTwitter retrouvez une liste de reporters, journalistes et bloggueurs à suivre sur Twitter. 

PS: Pour aller plus loin je vous conseille aussi Twitter.alltop.com agrégateur d'informations sur Twitter et Twitterati@alltop une compilation des 5 derniers messages de "l'élite Twitter".

Les tendances de la presse américaine sur Internet

Techcrunch publie (The Use of the Internet by America's Newspapers ) une étude réalisée par le cabinet de webdesign The Bivings Group. Celle-ci dresse, pour la troisième année consécutive, un panorama minutieux des pratiques des 100 premiers journaux américains sur Internet - de USA Today (2,28 millions d'ex) au Harrisburg Patriot News (95 588 ex). 

Les incontournables - vu sur tous les titres étudiés (ou presque) :

  • les flux RSS sont sur tous les sites. 95% des journaux offrent même des flux RSS distincts par rubriques.
  • la vidéo est présente d'une manière ou d'une autre sur tous les sites, passée de 61% des sites en 2006 à 92% en 2007.
  • les blogs de journalistes sont quasi-obligatoires avec 95% des journaux qui en proposent. [voir aussi le précieux et méticuleux tour d'horizon de la politique de blogs des médias français réalisé par François Guillot]
  • la publicité en ligne : liens sponsos, bannières, interstitielle - dans le cochon, tout est bon.

Les plus populaires - la généralisation la plus rapide :

  • le partage de favoris (social bookmarking) est devenu un "standard industriel", proposé sur 92% des sites contre 7% en 2006. Idée : promouvoir le contenu augmente le nombre de pages vues et donc les recettes publicitaires.
  • les commentaires sur articles. Sur 33% des sites en 2007, cette option existe maintenant chez 75% des journaux. "Une façon aisée pour les titres de jauger quels genres d'infos intéressent leurs lecteurs et de créer une communauté atour de leurs contenus".
  • 76% des sites proposent une section "les +" (lus/vus/emailés/commentés). La recommandation fait son trou.

Les émergents - ce qui perce

  • le site mobile s'impose désormais comme une option nécessaire sur 64% des titres, contre 53% en 2007.
  • les contenus générés par les utilisateurs (UGC) arrivent progressivement sur les sites : 58% acceptent des photos de leurs internautes, 18% de la vidéo, 15% des articles.  

Les losers - ce qui ne se fait plus

  • les podcasts sont en perte de vitesse, offerts sur 40 sites, contre 49 l'an passé.
  • l'inscription pour accéder à des contenus gratuits est bientôt en voie de disparition : 11% des sites le demandent en 2008, ils étaient encore 29% en 2007.

Les minoritaires - ce qui continue à exister poussivement

  • 10% des journaux ont créé un réseau social. C'est le double de l'année dernière, mais encore reste faible - contrairement aux attentes de Bivings.
  • les tags sont absents de 91% des sites.

Conclusion de l'étude :

"les journaux ouvrent leurs sites Internet à un nombre croissant d'utilisateurs. Cela montre un changement de la manière dont la presse américaine voit le Net : plutôt que de le considérer comme une menace pour son lectorat, l'industrie de la presse écrite commence à utiliser Internet pour créer des communautés en ligne autour de leurs publications."

"Les journaux ont affiné leurs outils et services qui améliorent l'accès à l'information et le partage avec une audience élargie. Plutôt que de s'intéresser à toutes les tendances d'Internet, ils se sont concentrés sur les outils qui améliorent leur relation avec leur lecteurs et augmentent les pages vues de leurs articles."

"les quotidiens sont concentrés sur l'amélioration de ce qu'ils ont déjà, quand la réinvention serait ce qui est nécessaire pour l'industrie de sortir de la crise actuelle."

Comprendre Google de l'intèrieur...


Ne ratez pas "What Would Google Do?" par Jeff Jarvis (de Buzz Machine). Le livre est dispo sur Amazon en précommande pour livraison le 2 Fevrier prochain!

 

Login to facebookVous êtes inscrit sur Facebook, cliquez sur le cadenas.
Login to Yahoo!Vous êtes inscrit sur Yahoo!, cliquez sur le cadenas.

 En devenant membre de mikiane.com vous aurez automatiquement accès aux HUMHUMs

- vous accéderez à des billets d'humeurs
- vous lirez les statuts et liens postés par les membres
- vous verrez la liste des utilisateurs connectés
- vous laisserez des messages aux membres
- vous entrerez plus facilement en contact avec moi
- on deviendra amis... :-) 
- sans compter tout plein d'autres petits goodies.

 

 

Mikiane.com est un Polyblog.
C'est un système qui permet différents niveaux de lecture en fonction de l'audience.
Les utilisateurs enregistrés ont accès à plus d'informations que les autres.
Pour être enregistré il suffit de créer un compte