Entries Tagged 'Advanced tools' ↓

Sentiment mining: new term, new field. A new web?

I read and excellent article in the NYT technology section today and came across a term that hits home: sentiment mining. A long time ago we posted about “We feel fine” and since then, it seems that sentiment mining has gone from an interesting art project to a money-making technology.

In the article, the founders of Tweetfeel said that the best they could get at recognizing sentiment with automated systems was 70-80% effectiveness. After our brief, inexaustive trial of Tweetfeel we feel it was more around 50-75%. It is a safe bet that it will take a long time before automated systems will be effective enough to make a quantitative evaluation of sentiment.

Solutions such as Tweefeel and ScoutLabs are excellent for gauging the zeitgeist or the direction of the wind, and they are cost effective for that purpose. But business questions are often impossible to formulate simply – and emerging trends almost always start as eddies in the main wind. The mathematical sophistication to find these eddies in torrents of data must be coupled with a human analysis at some point to understand the particular linguistic and cultural differences that arise in each particular business context.

Sentiment mining is a great term, but a little optimistic when not coupled with some form of qualitative analysis. When processor power grows even cheaper and when the tools now used by folks such as our local Nstein move out of the enterprise software domain and become more available to consumers, sentiment mining might simply become part of a normal web search… at that time, and not before, could we say that the new (aka semantic) web has arrived.

Social Network Analysis: from disillusionment to enlightenment

While reading Claude Malaison’s blog, I came across Gartner’s latest Hype Cycle graph. While Claude’s analysis mainly concentrated on the peak position of cloud computing and the eminent decline of the microblogging (sorry for those of you who can’t read in French) hype, my eye was drawn to the more mature technologies.

I was encouraged to see that Social Network Analysis was working its way out of the “trough of disillusionment” and onto the “path of enlightenment”. We here at Exvisu have been working from the get-go on advanced analysis techniques to mine knowledge from these masses of information and have gone from explaining what blogs are to dealing with the “disillusionment”.

gartner-emerging-technologies-hype-cycle-2009

Many of our clients (mostly those in big PR firms), have tried web-based social media monitoring/analysis services and have been disappointed in the actual amount of added value for business these services provide (in fact, just this morning one of our clients made that exact comment). Online social media monitoring services have made excellent advances in designing dashboards for presenting collected social media data and are completely sufficient for illustrating the most obvious trends in data, but the analysis part of social media analysis is usually quite light, as automated “one fits all” analysis tends to be.

The maturing of social network analysis spells a bright future for providers who have the expertise to adjust the analysis of social network data to create concrete solutions and solve real problems businesses might have. The NYT described this well earlier this month in an article about the increasing role of statisticians in social media analysis.

Let’s just hope that we can keep riding the wave onto the “plateau of productivity”.

Exvisu dans La Presse

Le titulaire de la Chaire de commerce électronique RBC Groupe Financier aux HEC, Sylvain Sénécal, a mentionné Exvisu dans un article publié ce matin dans La Presse.

Intitulé “La prise de pouvoir des consommateurs“, cet article insiste sur l’importance, pour une entreprise, d’être à l’écoute des consommateurs qui s’expriment sur le Web:

“la prise de pouvoir des consommateurs est là pour de bon et les entreprises devront s’adapter à cette réalité en utilisant ces nouveaux outils technologiques et ces sources de données abondantes afin de bâtir des meilleures relations avec leurs clients.”

Sylvain Sénécal mentionne Exvisu comme une entreprise d’ici capable d’aider les entreprises à recueillir et maîtriser les informations disponibles dans ce nouvel environnement.

What a Feeling! Montréal, Twitter et Obama

Je me suis amusée ce matin avec Claude à extraire et analyser les données relatives à Obama sur Twitter, publiées en français et en anglais dans la grande région de Montréal (Montréal et 25kms autour).

Jetez d’abord un coup d’œil sur la liste des 60 premiers mots associés au mot « Obama » dans les 282 tweets publiés dans la région montréalaise depuis le 16 janvier jusqu’à ce matin (cette association de mots est produite grâce à l’algorithme d’Exvisu qui a calculé la cooccurrence des mots utilisés dans les tweets). Je vous en propose ensuite une analyse sommaire sous forme de remarques.

1. barack
2. inauguration
3. rt
4. watch
5. president
6. happy
7. love
8. washington
9. nouvelle(s)
10. bush
11. speech
12. arrivée
13. Montréal/Montreal
14. live
15. history
16. vague
17. blackberry
18. américain
19. investiture
20. people
21. wave
22. gaza
23. carbon
24. video
25. international
26. expectations
27. commence
28. tomorrow
29. tv
30. espérer
31. official
32. cnn
33. war
34. idea
35. jointhewave
36. feeling
37. generator
38. twitter
39. change
40. fun
41. assermentation
42. pics
43. good
44. offer
45. président
46. comedy
47. portrait
48. world
49. work
50. train
51. promesses
52. monde
53. iphone
54. message
55. cool
56. coverage
57. martin
58. trêve
59. declared
60. union

Remarques
• Évidemment, le premier mot associé à Obama est son prénom, « Barack ». L’étonnant est que le mot « Michelle » n’est pas dans la liste des 60 premiers mots associés à Obama. En 122e place sur la liste, on ne peut pas dire qu’elle a été très présente dans le discours des derniers jours concernant l’inauguration d’Obama.
• Deux noms propres associés à Obama dans cette liste : Bush, et Martin (Luther King). Bush est bien positionné dans la liste, le 10e mot le plus associé à Obama… Cela suggère que l’inauguration d’Obama est également décrite comme le remplacement de Bush.
• Quelques mots font référence à la géographie. À part Washington (lieu de l’assermentation) et Montréal (qui fait référence aux activités entourant l’inauguration à Montréal), on retrouve « monde » et « Gaza » (ce dernier mot également lié à « trêve »). Cela reflète à la fois l’impact présumé d’Obama à l’international en général, et les attentes concernant le problème politique précis du moment.
• Le nombre de mots relatifs à des émotions ou à des attentes est prépondérant dans cette liste : happy, love, change, fun, good, espérer, union (des Américains), wave/vague, histoire, promesses, cool, expectations… L’inauguration d’Obama est fortement associée, non pas uniquement à un processus politique (illustré par quelques mots comme « assermentation », « président »), mais surtout à des sentiments. Autrement dit, cette liste de mots démontre que le changement apporté par Obama n’est pas seulement perçu comme un changement politique mais aussi « spirituel », au sens où l’ambiance générale est transformée. (Notons l’absence du mot « hope » en anglais, alors qu’« espérer » est présent en français.)
• Cette liste montre aussi l’intérêt des gens pour les choix faits par Obama dans sa vie quotidienne, relativement à certains enjeux : « portrait » fait référence à des discussions sur le premier portrait digital du Président; « blackberry » sur sa décision de garder ce téléphone; « carbon » pourrait aussi être placé dans cette catégorie, à cause du Obama Carbon Calculator, même si cela concerne les choix des gens qui participeront à l’inauguration plutôt que ceux d’Obama.
• Concernant les intérêts des Twitterers en particulier, on note la propension à discuter des moyens techniques qui auront servi à suivre l’inauguration d’Obama : tv, cnn, live, twitter, vidéo, pics, nouvelles, iphone… Notons l’absence du mot « Facebook » dans cette liste; il se trouve en 130e place dans la liste complète d’associations.
• Intéressant de voir le terme « RT » très haut dans la liste. Les tweets concernant Obama dans la dernière semaine, dans la région montréalaise, sont souvent des retweets. Peut-être a-t’on beaucoup re-twitté les tweets de nos voisins du Sud sur la question? Ce serait à vérifier.
• Et finalement, le mot « work » (49e position) fait référence au vice de tout bon twitterer qui se respecte : « Je devrais travailler, mais je suis trop occupé à suivre ce qu’on dit de l’inauguration dans les médias… » Ce n’est pas moi qui jetterai la première pierre! ;-)

À venir: Vendredi, un portrait sous forme graphique de la discussion montréalaise concernant Obama sur Twitter, mais un portrait du dernier mois en entier.

Assermentation de Barack Obama, Hôtel Opus, Montréal
Au lunch d’investiture sur écran géant à l’Hôtel Opus (Montréal), organisé par Martine St-Victor.

Sarah Palin, October 20

One of our most popular products is something we call a Conversation Capture. A Conversation Capture is an analysis of the entire blog-based discourse related to a particular subject. Our more advanced products are generally built with the intention of doing comparative analyses between, say, issues or brands or product features/benefits. For a Conversation Capture, we just take a single key concept and look at the discourse related to it in the blogs.

As a followup to our look at the Obama-McCain contest that we published in August, we decided to use this straightforward approach to take a look at a day of blog posts about Sarah Palin.

We built the dataset using posts from Monday, October 20 (840 posts total). This was the Monday following Palin’s appearance on Saturday Night Live. Our assumption going in was that the discussion about that would completely dominate.

What we found, however, was very interesting:

Conversation Capture - Sarah Palin - Oct 20

Conversation Capture - Sarah Palin - Oct 20

As you can see in the Lexical Map, there was a large discussion about SNL, but there was also a very large discussion about an interview Palin gave with the Christian Broadcasting Network, in which she discussed a Constitutional Amendment that would prevent states from recognizing Gay marriage, among other things. In addition, a lot of attention was given to a speech that Jon Stewart gave in Boston.

Even more interesting, though, was the cluster related to the way Alaska’s oil revenues are distributed. By the end of last week there was quite a bit of discussion about the hypocrisy of Palin’s attacks on Obama as a socialist and Alaska’s oil revenue policies – but here we see that even on that Monday, the issue was clearly emerging in the blogosphere.

One of the other tools we like to use for our Conversation Capture is to build a list of word co-occurrences. Here is a sample excerpt:

Co-Occ

Co-Occ

We see here as well that although the word “socialist” does appear often, it was not only used in the context of a description of her attacks on Obama but also related to the oil revenue situation in Alaska. As well, it is clear that her position on gay marriage is significant – more significant than Joe the Plumber, for sure.

Following the Canadian election online

There are quite a few good resources to help you follow the online face of the current Canadian Federal election campaign, but probably the most comprehensive set of tools has been built by our friends* at the Infoscape Research Lab in Toronto, who have built a really interesting suite in partnership with the CBC’s Ormiston Online. My personal favourite is the Blog MediaBuzz widget.

Zach Devereaux, one of Infoscape’s researchers, is a long-term friend of Exvisu’s. Zach is a top-notch researcher with whom we’ve worked on some really great projects.

Major Bugs in Google Blog Search

Last month I was working with Zach Devereaux (you can read some of his academic work with the team at Ryerson’s Infoscape Media Lab on the blogosphere surounding the liberal leadership race), who pointed out an excellent blog post from the Oxford Internet Institute that characterises some of the problems we here at Exvisu have come across regularly with Google Blog search.

A more insidious bug occurs with the language preferences. Google Blog Search will return fewer results when the Google interface language that you have specified in your Google preferences doesn’t match the language you want to search in.

Yesterday, Michael and I came across a brand new type of bug at Google Blog search: searches starting on Jan 1 2008 until the current date were only returning results dated after July 15. Of course now that I am writing this post, this problem seems to have been rectified. Strange indeed. Did anything special happen on July 15?

Feel free to try to reproduce all of the other bugs described in the OII post, those at least are longstanding and repeatable.

I don’t know about you but these problems make me want to cheer for all of those underdog search engines that are trying to break into market these days.

TextMap

The core of the work we do at Exvisu is using network analysis tools to draw out interesting and (often) hidden relationships between concepts. There are a lot of companies doing similar work in different ways, including TextMap, which bills itself as “The Entity Search Engine”. Lots of great information there!