Uncategorized

Readable Regex: a Small Fluent API

Les expressions régulières sont extrêmement puissantes, et souvent utilisées dans pas mal de tâches informatiques, notamment de traitement automatique des langues. Cependant, la nature complexe des phénomènes à traiter entraîne souvent des expressions qui sont des soupes de symboles, difficiles à comprendre et à modifier.

Problématique

Dans le cadre d’un des mes projets de recherche, j’ai récemment eu à écrire une expressions régulière très longue, dont la première particularité est d’avoir des classes de caractères assez longues. Exit donc [a-zA-z]. Et puisqu’il fallait des groupes de caractères plus précis que l’alphabet entier, l’utilisation de la classe unicode \p{Bopomofo} n’était pas possible.

Lire la suite « Readable Regex: a Small Fluent API »

Publicité
Uncategorized

Mon expérience de recherche en République Tchèque

Contexte

Je suis tombé par hasard sur des informations concernant une bourse de recherche proposée par le ministère de l’éducation, de la jeunesse et des sports. Pour une fois, il s’agissait de quelque chose parfaitement adapté à ma situation : pas de nécessité de s’inscrire à un diplôme même si c’est possible, et surtout également disponible pour les personnes déjà diplômées. Étant fraîchement diplômé de master(s), avec un an à occuper en Europe, c’était l’opportunité d’aller faire de la recherche, de découvrir un nouveau pays et une nouvelle culture et bien entendu de rencontrer de nouvelles personnes. J’ai donc réfléchi littéralement deux secondes avant de me dire que j’allais postuler… et grand bien m’en a pris ! Jusqu’à présent, cela m’a déjà permis de publier mon article de recherche via la participation à un workshop 🙂 Lire la suite « Mon expérience de recherche en République Tchèque »

Uncategorized

MEXT Graduate Scholarship: Research Project (3/3)

Finally, here’s the post about the most important part of the application: the research project. There is multiple difficulties to writing it, one pertaining to the format, the other one to the content.

Format of the proposal

The first issue is to understand how the proposal is physically structured. Two documents are required: one named « Field of Study and Research Program Plan » (FSRPP) and another you have to write yourself on a blank sheet (let’s call it BSRP). The FSRPP contains three questions and it doesn’t help that the last two of them are quite similar. Compare Your research topic in Japan: Describe articulately the research you wish to carry out in Japan vs Study program in Japan: (Describe in detail and with specifics — particularly concerning the ultimate goal(s) of your research in Japan). Because they are so similar I treated them a one question, but put emphasis on details in the second one.
Lire la suite « MEXT Graduate Scholarship: Research Project (3/3) »

Uncategorized

MEXT Graduate Scholarship: the Interview (2/3)

The most scary part of the application to the MEXT scholarship is probably the interview. Because you’ll have to speak to real humans (😱), of the relative scarcity of information around it and the high variability of the event itself.

As said, this is the step for which there is the most variations between countries, domain of study (science or humanities) and even between people. The information provided here are drawn mostly from my own experience and from talk to a friend and a girl I met at the exam step.

Lire la suite « MEXT Graduate Scholarship: the Interview (2/3) »

Uncategorized

Creative Commons Content: Save it Before Needing it

TL;DR: Save CC content you use or care about and put it online for others as well. It might not be available in the future from its primary source anymore.

Context

Today it happened for to me for the third time in a limited time frame: content I was looking for wasn’t available anymore. Not that the page itself was gone 404 but because politics. Was the most infuriating stuff here? The content was under a Creative Commons license. Let’s see the subtle way theses resources have gone unavailable while still being on the Web.

Lire la suite « Creative Commons Content: Save it Before Needing it »

Uncategorized

MEXT Graduate Scholarship: Trivia (1/3)

What is the MEXT Scholarship?

First, there not one but various scholarship offered by the ministry of education of Japan also known as MEXT, monbusho (former ministry name) and monbukagakusho (current name). In France, two are offered: the research scholarship and the language & civilization scholarship. The research one targets people who own at least a bachelor degree (licence) while the language scholarship is available only to people currently enrolled in a Japanese bachelor degree. In some countries a undergraduate scholarship is also available.

This post discuss only the research scholarship. I will give you my tips & insights gained when I applied for it.

Lire la suite « MEXT Graduate Scholarship: Trivia (1/3) »

Uncategorized

Docker Compose Tutorial with Full Code Sample 🐋

It have been twice I tried to use Docker. The software is very promising, but it can be hard to understand both what problem it solves, how it does it and how to use it. A lot of introductions blog posts explain these points quite well, so in this post I’d rather focus on a global explanation of the setup I made. It will not be deep Docker tinkering — quite the reverse indeed — but provide explanations of concepts that are splited on multiple documentation pages. If you want to get started without 5 browsers tab browsing documentation, you’re at the right place!
Lire la suite « Docker Compose Tutorial with Full Code Sample 🐋 »

Uncategorized

Quand un VHD vous pête à la gueule

Hier soir j’ai eu une idée géniale ! Le genre d’idée qui m’a encore fait griffonner hâtivement quelques feuilles de papier. Le lendemain, j’en noircis encore quelques unes et je me mets au code. Ça m’avait manqué. Du bon gros Windows Phone 8.0 Silverlight qui tâche, parce que pour un prototype autant capitaliser sur ce avec quoi je suis le plus à l’aise et pour lequel j’ai les outils de développement. Le point noir c’est que je travaille en machine virtuelle…
Lire la suite « Quand un VHD vous pête à la gueule »

Uncategorized

Nuget package restore of Hell & AppHarbor

Le cloud c’est bien, mais c’est toujours mieux de programmer un projet de manière multi-plateforme (et j’entends par là la possibilité de le déployer sur différents fournisseurs de services) puisque ça permet de ne pas être tributaire, et donc prisonnier, du fournisseur choisi en premier lieu.

C’est pourquoi, en plus du support d’Azure Websites (dont la facilité d’utilisation est le plus grand atout) j’ai tenté pour mon projet en cours de supporter également AppHarbor. Il s’agit d’une plateforme d’hébergement cloud PaaS (qui utilise des instances AWS en sous-main) qui se veut le Heroku du monde .net et qui a la particularité de faire aussi aussi de service de build et de travailler avec les sources du projet.
Lire la suite « Nuget package restore of Hell & AppHarbor »