La recherche est tributaire des données, qui constituent la base de l'acquisition de connaissances scientifiques. Les données à prendre en compte varient en fonction du domaine de recherche, de la problématique et de la méthodologie. La recherche qualitative utilise ainsi souvent des données hétérogènes, multimodales et à peine standardisées. La recherche quantitative est elle tributaire de grandes quantités de données pouvant être comparées et évaluées statistiquement.

Le défi des données personnelles et sensibles

La numérisation a créé un nouveau contexte pour ces deux approches. Des sources de données et champs de recherche nouveaux sont apparus, en plus de la quantité de données, de la simplification de l'accès et des possibilités de mise en relation. S'il y a un potentiel d'amélioration des connaissances, de nouveaux défis se présentent, notamment en ce qui concerne les données personnelles et les données sensibles. La protection des données freine-t-elle le développement d'approches de recherche innovantes? Comment la législation et l'éthique interagissent-elles? Et quel rôle jouent des solutions d'infrastructure sécurisées?

Culture d'utilisation des données et structures de gouvernance

Fin novembre, deux événements ont abordé ces questions. Lors d'un événement organisé dans le cadre de l'initiative de numérisation du canton de Zurich (DIZH), l'accent a été mis sur les défis pratiques, éthiques et juridiques liés à l'utilisation des données de recherche dans une société numérique. Des spécialistes ont notamment discuté des réglementations judicieuses de l'accès aux différentes données de recherche. Ils se sont aussi demandés si une éthique de la recherche forte pouvait remplacer la protection des données dans certains domaines. Lors de l'atelier commun «Safe Access to Sensitive Research Data» organisé par FORS et la Haute école spécialisée des Grisons, il a en revanche été question de solutions d'infrastructure sûres pour l'utilisation de données (de recherche) sensibles. Des modèles et perspectives au niveau international (Grande-Bretagne, Norvège, France, Allemagne) comme national ont été présentés et discutés dans différents groupes. Il est apparu clairement que les infrastructures d'accès aux données sont avant tout marquées par les cultures d'utilisation des données dominantes et les structures de gouvernance respectives. Le 5-Safes-Framework est désormais établi partout. Il s'agit de principes qui permettent un accès sûr aux données de recherche. Ces principes se rapportent à la sécurité des données, aux projets de recherche, aux personnes, aux conditions-cadres et aux connaissances.

Ethique, droit et infrastructures

L'éthique, le droit et les infrastructures sont complémentaires en matière de (traitement) des données. Lors du développement d'une politique d'utilisation des données, nous nous penchons nous aussi sur ces différents aspects. Dans ce contexte, nous suivons de près les développements actuels dans le domaine de la réutilisation des données.

Articles associés

En raison de la rapidité des progrès technologiques, les conditions-cadres des technologies d'IA sont souvent peu claires, également dans le domaine de l'éducation. Le projet «Sandbox de l'innovation pour l'IA» vise à clarifier la réglementation. Raphael von Thiessen, chef du projet Sandbox du canton de Zurich, explique la démarche.

La meilleure façon d'apprendre une langue étrangère est de la parler. Le temps de parole est toutefois souvent insuffisant dans le cadre scolaire. Un chatbot basé sur la voix pourrait y remédier. Co-directeur du projet «Towards a Voice-based Chatbot for Language Learners (ChaLL)», Michael Geiss de la HEP de Zurich explique notamment quelles sont les prémisses à respecter.

Le 1er septembre 2023, la loi fédérale révisée sur la protection des données est entrée en vigueur. Pour les personnes privées (y compris les entreprises) et les organes fédéraux, cela implique des changements importants dans la manière de traiter les données personnelles et d'informer.

La collaboration avec des projets d'utilisation des données nous permet d'éclairer l'écosystème des «données de l'éducation» à l'aide de cas concrets issus de la pratique et de tester des solutions à la croisée des différents groupes d'intérêts. Les expériences faites jusqu'à présent le montrent: malgré toute l'hétérogénéité, les mêmes questions préoccupent.