Le développement et la pérennité de BALSAC sont assurés par sa participation à divers projets de recherche et aussi par la création et le déploiement d’infrastructures de recherche complémentaires. Au coeur de ces initiatives on y retrouve le fichier BALSAC, en tout ou en partie, auquel s’adjoignent des données de diverses natures destinées à enrichir les avenues de recherche. Ci-après, un aperçu des projets en cours de réalisation.

i-BALSAC : Une infrastructure multisectorielle pour une cartographie haute-résolution de la population franco-canadienne
2019-2022

Trois types de demandes exprimées par la communauté scientifique au cours des dernières années. D’abord, les chercheurs en génomique qui travaillent avec les informations généalogiques souhaitent l’intégration au sein d’une structure formelle et pérenne des données généalogiques et génétiques ; pour l’instant, celles-ci ne sont mises en relation que dans le cadre de projets spécifiques pour une durée déterminée. Ensuite, le prolongement jusqu’au 20e siècle de la période pour laquelle nous disposons d’une reconstitution exhaustive de la population québécoise établie à partir de l’ensemble des actes de l’état civil (naissances, mariages et décès), suscite un grand intérêt chez les chercheurs tant du côté des sciences sociales que de celui des sciences biologiques, entre autres pour les études de biologie évolutive. Enfin, dans la foulée du tournant géographique (spatial turn) qui s’est opéré dans les sciences sociales, il nous paraît essentiel d’offrir un cadre d’analyse et d’interprétation de la dimension spatiale pour les données généalogiques et génétiques.

C’est en réponse à ces besoins qu’a été élaboré le projet de création de l’infrastructure BALSAC (i-BALSAC), une plateforme multisectorielle dynamique et polyvalente destinée à la recherche de pointe en sciences biologiques et sociales. Le fichier de population BALSAC constitue le socle de cette infrastructure qui repose sur l’intégration et la mise en relation de données généalogiques, génétiques et géographiques. Le projet comprend aussi le développement d’outils analytiques et statistiques (appuyés sur l’exploitation conjointe des données généalogiques et génétiques) et cartographiques (construction d’un système d’information géographique (SIG) historique) qui permettront d’optimiser l’exploitation de ces ensembles de données. Il s’inscrit dans le prolongement de partenariats avec le CIEQ et le PRDH ainsi qu’avec la plateforme de recherche CARTaGENE et ouvrira la voie à l’établissement de nouvelles collaborations prometteuses, notamment avec Bibliothèque et Archives nationales du Québec (BAnQ) pour le volet démographique et Génome Québec pour le volet génétique.

La construction de i-BALSAC permettra de réaliser une cartographie haute résolution de la population franco-canadienne par une approche génomique, généalogique et géographique, et offrira un regard historique sur quatre siècles. Elle donnera accès à un vaste ensemble d’informations biographiques localisées dans le temps et l’espace permettant ainsi l’étude des populations sur la base des trajectoires individuelles au sein de familles et de communautés dans une perspective multigénérationnelle. À notre connaissance, aucune population à l’échelle mondiale n’a, à ce jour, été caractérisée à un tel niveau de précision, de complétude et de profondeur temporelle. L’idée d’une telle infrastructure est tout particulièrement appropriée pour la population franco-canadienne notamment en raison des modalités de sa formation (effet fondateur initial, présence de métissage, diversité des histoires de peuplement régionales), de la structure génétique qui en résulte et de la qualité exceptionnelle des données généalogiques qui n’ont pas d’équivalent en Amérique du Nord. À terme, l’infrastructure formera un laboratoire d’étude des populations et un lieu d’échange pour les chercheurs d’horizons disciplinaires variés. Elle permettra d’aborder des questions de recherche complexes reposant sur des études multidisciplinaires innovantes. Tant les chercheurs en sciences sociales que ceux en sciences biomédicales pourront bénéficier de cette nouvelle infrastructure de recherche. Les sections suivantes présentent un aperçu des travaux de recherche qui pourront être réalisés à l’aide de i‑BALSAC.

Trois siècles de migration francophone en Amérique du Nord (1840-1914)
2019-2026

Le projet vise à mettre en lumière la place centrale des migrations francophones dans la genèse et l’évolution des populations nord-américaines sur une période de trois siècles. Il nourrira ainsi les réflexions sur les enjeux contemporains de l’immigration, de la diversité culturelle et du vivre-ensemble. Le projet a pour but d’examiner l’impact des migrations sur l’expérience collective et individuelle des francophones en Amérique du Nord. Pour ce faire, l’équipe, composée de partenaires et de participants, étudie selon des perspectives novatrices et de manière concertée : 1) les mouvements et processus migratoires des francophones nord-américains ; 2) les circulations culturelles et linguistiques qui les ont accompagnés ; 3) les récits auxquels ils ont donné lieu.

Ces trois axes sont analysés à partir : 1) d’une perspective interdisciplinaire alliant les savoir-faire patrimoniaux et universitaires ; 2) d’une variété d’échelles spatiales, sociales et temporelles ; 3) des multiples interactions perceptibles tant au niveau macro que micro.

Quatre groupes font l’objet de cette vaste enquête : 1) les Acadiens, dont les origines remontent au début du 17e siècle et dont le déploiement sur la côte atlantique est bouleversé par le Grand Dérangement (1750-1800) ; 2) les Canadiens français, issus de la vallée du Saint-Laurent à partir du XVIIe siècle et qui, progressivement, deviennent présents dans l’ensemble de l’Amérique du Nord ; 3) les Métis, nés de la rencontre entre Européens et Premières Nations, qui occupent à la fin du 18e siècle et au 19e siècle de grands pans du centre et de l’ouest du continent ; 4) les migrants provenant de France, de Belgique, de Suisse et de Syrie (y compris le territoire de l’actuel Liban) qui séjournent ou s’établissent sur le continent.

La problématique, qui repose sur l’analyse combinée des mouvements et processus migratoires, des circulations culturelles et linguistiques, ainsi que des récits, est originale. Pour la première fois, une équipe interdisciplinaire formée d’historiens, de géographes, de démographes, de linguistes, d’ethnologues, de sociologues, d’économistes et de spécialistes des études littéraires et culturelles analyse ces trois composantes à diverses échelles temporelles, sociales et spatiales, en mettant à profit de nombreuses sources et bases de données.

D’une grande ampleur, ce projet rassemble 41 participants et 27 partenaires, patrimoniaux et universitaires, provenant du Canada, des États-Unis et d’Europe. Grâce à leurs expertises variées en recherche et en matière de mobilisation des connaissances, les 11 partenaires patrimoniaux exercent un leadership intellectuel au sein de l’équipe.

Les connaissances produites sont diffusées en faisant largement appel aux récents développements des technologies de l’information et des communications, sans toutefois renoncer aux modes de diffusion classiques. Le projet culmine avec la création d’une exposition virtuelle bilingue. En somme, il rejoint autant la communauté scientifique, y compris les étudiants, que les membres et clientèles des organismes partenaires, les écoliers ainsi que tout public intéressé par la présence francophone en Amérique du Nord.

Cohorte participative du Québec (COPAQ)
2019-2020

Au cours des cinq dernières années, un marché concurrentiel s’est développé autour des tests génétiques à grand déploiement. Principalement par le biais de l’entreprise privée, le public a maintenant accès au séquençage et à l’analyse partielle de son génome, et ce, à peu de frais. Moyennant certains frais et un échantillon de salive, les utilisateurs reçoivent de l’information sur les origines géographiques de leurs ancêtres, sur leurs liens généalogiques avec d’autres utilisateurs et, dans certains cas, sur leurs facteurs de risque génétiques. Les utilisateurs ont de plus accès aux données brutes de leur test génétique et peuvent les utiliser dans d’autres projets à des fins éducatives ou de recherche.

Ces services de tests génétiques ont permis d’assembler des cohortes de tailles spectaculaires. Toutefois, elles demeurent sous le contrôle des entreprises privées. Les possibilités de recherches fondamentales sont ainsi sévèrement limitées puisqu’elles sont subordonnées à la commercialisation des données. De plus, malgré le fait que ce partage de données sensibles soit fait avec l’accord des utilisateurs, ce modèle d’affaires va à l’encontre des initiatives publiques qui misent plutôt sur la transparence et le libre accès. Du point de vue du participant, ce modèle se traduit par une expérience unilatérale. Il est écarté des résultats de recherche et n’a qu’une participation indirecte au processus de création.

En réponse à cette problématique, nous souhaitons proposer une option ouverte et publique en tirant avantage des efforts déjà investis par l’entreprise privée. Notre objectif est de développer une plateforme de science participative, COPAQ, destinée à la collecte, au partage et à l’interprétation vulgarisée des résultats de la recherche sur les populations. Elle s’adressera principalement aux individus ayant déjà réalisé un test génétique et dont l’histoire familiale se déroule en tout ou en partie sur le territoire québécois. La cohorte de COPAQ sera constituée de tous les utilisateurs qui auront donné leur consentement et fourni leur information génétique et généalogiques en contrepartie de l’engagement des chercheurs à donner de l’information en retour aux participants. Alors que les services généalogiques offerts sur Internet s’appuient sur un bassin de participants restreint, la cohorte de COPAQ regroupera des participants rattachés à l’arbre généalogique quasi complet de la population québécoise remontant jusqu’au début du 17e siècle par le biais du fichier de population BALSAC.

Ultimement, nous créerons une grande cohorte de référence de la population québécoise composée de données génétiques et généalogiques accessibles, sous forme dénominalisée, à l’ensemble de la communauté scientifique. En échange, les chercheurs désirant utiliser cette cohorte s’engageront à entrer en communication avec les participants par le biais d’un module s’inspirant des réseaux sociaux. Ce module permettra aux chercheurs de tenir les participants informés des progrès de leurs recherches, mais permettra également une collecte additionnelle d’informations.

En matière de retombées, cette approche comporte 3 avantages : elle valorise le contenu scientifique et en fait un outil de formation pour la population non initiée au potentiel de l’utilisation des données génétiques et aux limites de leur interprétation; elle favorise et accélère des recrutements massifs qui fournissent aux chercheurs des données précieuses pour la recherche; et elle contribue à bâtir de nouveaux ponts entre la science et la société en rendant la première plus accessible.

Infrastructure intégrée des microdonnées historiques de la population du Québec
2013-2017

Ce projet repose sur un partenariat entre trois entités : le Projet BALSAC à l’Université du Québec à Chicoutimi (UQAC), le Programme de recherches en démographie historique (PRDH) à l’Université de Montréal (UdeM) et le Centre interuniversitaire d’études québécoises (CIEQ) à l’Université du Québec à Trois-Rivières (UQTR). Ces trois groupes sont solidement implantés dans leurs institutions respectives et dans le milieu de la recherche au Québec et au Canada.

La mise en place de cette infrastructure a d’abord reposé sur le regroupement de bases de données sur la population québécoise dont la construction remonte pour le RPQA, qui est la plus ancienne, au milieu des années 1960. Ces bases de données ont été développées principalement à partir de l’informatisation des actes d’état civil (naissances, mariages et décès) du Québec et des listes manuscrites des recensements canadiens. À cela s’ajoute les données de sept recensements nominatifs canadiens pour les régions de la Côte-Nord, du Saguenay, de la Gaspésie ainsi que les villes de Trois-Rivières et de Québec entre 1851 et 1911. Ce qui constitue l’aspect le plus novateur de ce projet, c’est sans doute le jumelage des données d’état civil aux données de recensements.

Les données de l’IMPQ, dont l’accès se trouve ici, donne accès à un vaste ensemble d’informations biographiques permettant l’étude des populations historiques sur la base des trajectoires individuelles au sein des familles, des ménages et des communautés dans une perspective multigénérationnelle. L’état civil se prête en effet à tous les types de travaux en lien avec la famille (natalité, mortalité, nuptialité, migrations, transmission intergénérationnelle) ou qui prennent en considération le rôle de la parenté. Pour leur part, les recensements nominatifs permettent les études en lien avec le ménage (taille et composition, rôles des membres, modèles résidentiels, structures socioprofessionnelles, revenus, scolarisation) ou les stratégies économiques à micro-échelle. L’établissement des liens entre l’état civil et les recensements d’une part et entre les recensements d’autre part permettra des études à un niveau de précision inégalé sur une période cruciale de l’histoire de la population québécoise : entre le milieu du 19e siècle et les années 1910, on assiste en effet, à l’extension de l’écoumène par la progression du peuplement agricole, maritime et forestier, au passage à une économie industrielle et à une urbanisation accélérée. Il sera possible de se pencher pour la première fois sur l’évolution et les conséquences à long terme de phénomènes comme la diversité culturelle, la mobilité sociale et les rapports intercommunautaires. Sur ce plan, l’une des retombées intellectuelles les plus spectaculaires sera de mettre au jour les profils de vie trop souvent occultés de la moitié de la population : les femmes. À ce jour, en effet, la transformation des conditions d’existence des femmes tout au long de leur cycle de vie nous échappe largement, puisque les recensements ne livrent pas les noms de jeune fille des femmes mariées.

Enfin, les données ouvrent également des avenues intéressantes du côté de la biodémographie notamment par des travaux entourant la transmission des traits biologiques et socioculturels de la population, lesquels font d’ailleurs de plus en plus place à l’analyse des conditions de vie des individus. Les études portant sur la structure génétique de la population québécoise (consanguinité et apparentement, origines ancestrales, facteurs de stratification) et sur l’impact de l’histoire démographique sur l’évolution des bassins génétiques locaux et régionaux (distribution et fréquence des variants neutres ou associés à des maladies) ont reposé jusqu’à maintenant surtout sur les lignées généalogiques (et donc sur les mariages). La possibilité d’intégrer aux analyses des données provenant des naissances et des décès ou celles des recensements permettra d’articuler plus étroitement les travaux aux développements actuels de la génétique des populations humaines.