How to mention the use of BALSAC data for publications

Data access statement from the BALSAC database

The data that support the findings of this study are available upon request from the BALSAC Project. Access to the data is restricted by ethical regulations surrounding the use of population data for scientific research.

Data access statement from IMPQ data through BALSAC research service

Access to some of the data used for this work was provided by the Integrated Infrastructure of Historical Microdata of the Population of Québec (IMPQ), through the BALSAC Project.

Data access statement from ERRQ data through BALSAC research service

Access to some of the data used for this work was provided by the Quebec Regional Reference Sample (ERRQ), through the BALSAC Project.

How to obtain a DOI related to my dataset

As of December 2021, BALSAC allows to deposit researcher’s datasets on the Dataverse platform. This open-source platform allows for the preservation, sharing, citation, search, and analysis of research data. If publication requirements ask you to provide a DOI, please contact the BALSAC Researcher Services (balsac@uqac.ca). We will be happy to deposit your dataset unto BALSAC-Dataverse .

Database description

Brief description of the BALSAC database

This study uses data on the population of Quebec from the BALSAC population file. The BALSAC database, developed since 1971 at the Université du Québec à Chicoutimi, contains data on the Quebec population from the beginning of European settlement in the 17th century to the contemporary period. These data come from the digitization of civil records and have been linked together in order to reconstruct families and genealogical lines over nearly 400 years. Today, BALSAC is a major research infrastructure used by researchers from Quebec and elsewhere, in both the social and biomedical sciences. BALSAC now contains data on more than 6 million known individuals over a period extending from 1621 to the present. siècle jusqu’à la période contemporaine. Ces données proviennent principalement de l’informatisation des actes de l’état civil et ont été reliées entre elles de façon à reconstruire les familles et les lignées généalogiques sur près de 400 ans. Aujourd’hui, BALSAC est une infrastructure de recherche majeure utilisée par des chercheurs du Québec et d’ailleurs, et ce, tant dans le domaine des sciences sociales et que dans celui des sciences biomédicales. BALSAC contient désormais des données sur plus de 6 millions d’individus connus sur une période s’étendant de 1621 à aujourd’hui.

Brief description of IMPQ

This study uses data on the population of Quebec taken from the Integrated Infrastructure of Historical Microdata of the Population of Québec (IMPQ). The IMPQ allows access to a wide range of microdata from Quebec’s civil records (1621-1914) and Canadian censuses (1852-1911). The IMPQ is the outcome of a partnership between the BALSAC project at the Université du Québec à Chicoutimi, the Centre interuniversitaire d’études québécoises (CIEQ) based at the University du Québec à Trois-Rivières and the Programme de recherche en démographie historique (PRDH) from the Université de Montréal. It brings together more than twelve million mentions of individuals connected through more than 300 million family links. The microdata come from the digitization of a body of documents covering almost three centuries and composed of: Quebec’s marriage records-between 1621 and 1914; births and deaths recorded in Quebec from 1621 to 1849; and births and deaths recorded before 1914 in the Saguenay-Lac-Saint-Jean region. To this has been added the microdata from seven Canadian census conducted between 1851 and 1911 and covering the city of Quebec and Trois-Rivières, and the regions of Saguenay-Lac-Saint-Jean, Cote-Nord and the Gaspe peninsula.

Brief description of ERRQ

Cette étude utilise des données tirées de l’échantillon de référence régional québécois (ERRQ), constitué d’échantillons génomiques couplés avec des données généalogiques, collectées par le laboratoire du professeur Damian Labuda au Centre de recherche du CHUSJ en collaboration avec Hélène Vézina, directrice du projet BALSAC à l’UQAC.  Deux types de données ont été générées à partir de cette banque d’échantillons génomiques : 1) des données génétiques de génotypage pour 823 individus provenant de 6 régions : Gaspésie, Côte-Nord, Québec et ses environs, Montréal et ses environs, Abitibi, Outaouais et, 2) des données généalogiques produites à l’aide du fichier BALSAC lors du projet de recherche initial. Aucune donnée phénotypique n’a été recueillie et cette cohorte est exempte de biais médical.