Intelligence artificielle (IA) : quand commence la RS&DE? De plus en plus d’entreprises investissent dans l’intégration d’initiatives en intelligence artificielle (IA). Ces travaux amènent plusieurs complexités afin de les adapter à leurs contextes. Or, la question que l’on peut se poser : est-ce que ces travaux sont admissibles au programme de crédits d’impôt pour la RS&DE? La réponse est « peut-être ». Dans le cadre de ce billet, mon exemple se limitera au concept d’apprentissage automatique (Machine learning) afin de créer des agents logiciels capables d’améliorer leurs performances à résoudre des tâches sans être explicitement programmés pour chacune. Mise en contexte Dans le cadre d’un projet portant sur l’analyse de documents afin d’en extraire des éléments précis, des travaux ont été réalisés à partir de cadres applicatifs, de services ou de librairies existantes, implémentant des algorithmes connus, et dont l’apprentissage a possiblement déjà été réalisé. Des problèmes ont été rencontrés au cours de cette phase exploratoire. Les données étaient insuffisantes ou mal adaptées à l’entrainement. Base des connaissances La plupart des gens qui tentent de traiter des données textuelles combinent l’utilisation d’un algorithme et d’un réseau de neurones récurrents (RNN) à mémoire court-terme et long terme, tels que LSTM et BiLSTM. Cependant, bien que cette utilisation soit peu éloignée du présent contexte, les techniques conventionnelles (p. ex., recherche de mots-clés ou de structures fixes) ne permettent pas d’extraire les éléments désirés. En effet, méthodes et techniques d’apprentissage automatique existantes nécessitent des ensembles de données de qualité. Dans un monde réel, les mots mal orthographiés, une grammaire déficiente, des données bruitées, manquantes ou corrompues ne sont que quelques-uns des exemples d’imprévus qui peuvent rendre le plus performant des systèmes inutilisables. Des biais présents dans les ensembles d’entraînement peuvent également induire des distorsions qui ne sont pas toujours évidentes à déceler. Outre la qualité, le volume de données est aussi important. Il faut disposer d’un TRÈS grand volume de données pour entrainer les systèmes existants, ce qui n’est pas toujours possible dans un court laps de temps et à un coût raisonnable, voire totalement impossible. Des techniques d’augmentation de données peuvent éventuellement venir palier à ces problèmes, au risque parfois d’induire encore de nouveaux biais. Des techniques complémentaires peuvent être utilisées, utilisant par exemple des réseaux pré-entrainés. Mais les développements dans le secteur de l’IA s’effectuant principalement en anglais, les algorithmes actuels sont mieux entrainés avec des données anglophones, ce qui peut poser problèmes lors de l’utilisation d’une autre langue et sans avoir accès à des corpus d’entrainement équivalents ou adapté au contexte d’utilisation. Enfin, même si on disposait d’une très grande quantité de données de qualité, rien ne garantirait que le résultat converge comme désiré. Les RNN ne sont donc possiblement pas la technique la plus performante dans ce contexte. Ces problématiques sont-elles suffisantes pour créer un contexte de RS&DE? Pas nécessairement. En IA, le gros défi est de discerner si nous sommes dans un processus d’exploration des connaissances existantes ou bien hors des sentiers battus. La popularité de l’IA fait en sorte qu’il existe beaucoup de documentation sur le sujet. Par exemple, des pistes de solutions ont été identifiées afin de surmonter les limites des connaissances, mais ces pistes sont déjà connues et étudiées par d’autres. Il y a donc beaucoup d’information à la portée des développeurs. Toutefois, rien ne garantit que ces informations permettent d’obtenir une solution fonctionnelle. De plus, l’absence de certitude ne suffit pas à engendrer un projet RS&DE. Dans le cas présent, un projet potentiellement admissible au programme aurait porté sur : Le développement d’un nouveau procédé externe au système existant d’apprentissage afin de l’adapter à un contexte autre que pour celui pour lequel il a été prévu et le rendre plus résilient. Bref Le secteur de l’IA évolue rapidement tout comme sa base de connaissances, mais cela ne signifie pas que ces connaissances sont suffisantes pour répondre à vos besoins. Vous allez alors possiblement chercher à développer de nouvelles méthodes qui vous sont propres. Mais ces nouvelles connaissances seront telles admissibles à la RS&DE? Potentiellement! Crédit photo : GDJ via pixabay.