Cortext platform
At Cortext, our goal is to empower researchers in the social sciences and humanities by promoting advanced qualitative-quantitative mixed methods. Our primary focus is on studies about the dynamics of science, technology and innovation, and about the roles of knowledge and expertise in societies.
We understand the move towards digital humanities and computational methods not as addressing a technological gap for the social sciences, but rather as entailing entirely new assemblages between its disciplines and those of modern statistics and computer sciences. We work to tackle ever more complex research problems and deal with the profusion of new and diverse sources of information without losing sight of the situatedness and reflexivity required of studies of human societies.
Cortext is hosted by the LISIS research unit at Gustave Eiffel University, and was launched by French institutes IFRIS and INRAE, receiving their continued support.
Cortext Manager
Cortext Manager is our current main attraction, a publicly available web service providing data analysis methods curated and developed by our team of researchers and engineers.
You upload a textual corpus in order to analyse its discourse, names, categories, citations, places, dates etc, with methods for science/controversy/issue mapping, distant reading, document clustering, geo-spatial and network visualizations, and more.
You can jump straight to Cortext Manager and create an account, but we strongly suggest taking a look at the Documentation and Tutorials as you start your journey.
Latest journal articles employing our instruments
PhD Theses
2022
McIlwaine, Neil
A market analysis of customer-connected mass energy storage PhD Thesis
2022, (EThOS ID: uk.bl.ethos.854974).
@phdthesis{nokey,
title = {A market analysis of customer-connected mass energy storage},
author = {Neil McIlwaine},
url = {https://ethos.bl.uk/OrderDetails.do?uin=uk.bl.ethos.854974
https://pure.qub.ac.uk/files/320007520/Thesis_Neil_McIlwaine_rev_33rev1_NMC.pdf},
year = {2022},
date = {2022-06-01},
urldate = {2022-06-01},
institution = {Queen's University Belfast},
abstract = {The electricity operators on the island of Ireland have policy objectives to generate at least 70% of electricity from renewable sources by 2030. The source of this renewable power will mainly be wind and storage is needed to facilitate this transition. However, to date the roll out and market uptake of storage has been slow in the Irish grid. Therefore, this research undertook a market analysis of the technical and economic value of distributed mass energy storage to examine storage considering these targets. The research uses the Irish market as a case study with specific modelling on the Northern Ireland system which is a subset of the overall market. The modelling and the results of the research are applicable and relevant to all regions which operate with a high share of renewables. The research had four parts. In part 1, a global techno-economic review of the status of energy storage and power quality services focusing on ten countries with differing political, social, and economic trends was undertaken. This led to a combined strengths, weaknesses, opportunities, and threats (SWOT) appraisal informed by the data and information from the ten countries response to embedded and distributed renewable generation and storage. The SWOT analysis is then coupled to a Pugh chart to indicate optimal concept choice in the later analyses. Then in part 2, a gap analysis of the ten countries to determine the frameworks and approaches used to regulate, plan, and operate retail electricity markets was carried out in order to inform the modelling. Next in part 3, a suite of financial models was developed to quantify the market revenue available for battery storage investment that could provide ancillary services, network congestion relief and response to local system events. Then a dynamic economic dispatch model in MATLAB was developed to test the economic production schedule with and without battery storage and a unit commitment model was developed to determine the costs of providing system reserve using fossil fuel generation so a comparison could be made in the scenario where the reserve is provided by battery storage. The key finding is that the revenue available from the current schemes are insufficient to attract investment in energy storage. It is recommended that system operators reform the existing schemes, design new schemes and look to the wider benefits that energy storage brings to fossil fuels generation. Finally, in part 4, a unit commitment wholesale electricity market model of the SEM focusing on the Northern Ireland system was developed in Energy Exemplar's PLEXOS for Power Systems. It makes for an interesting case study for other jurisdictions as it is an electrically isolated grid with limited interconnection and storage but operating with a high share of renewables. Here four combinations of wind generation and load were assessed to measure the effect of varying levels of battery storage. The benefits of storage were clearly demonstrated with reductions in emission levels and generation costs, load smoothing, ramping reduction, reduced maintenance and reduced curtailment of renewables. For example, the monthly model run with 300 MW of battery storage at 70% SNSP resulted in a generation cost decrease of £500k, an emission decrease of 28k tonnes CO2, and total ramping decrease of 478 hours compared to the no storage scenario. Currently revenue streams for provision of these benefits associated with generation and demonstrated by the modelling do not exist. Therefore, it is recommended that these services are properly valued in order to attract future investment. Overall, this research clearly demonstrates the gap that exists between the positive benefits of battery storage and the less than adequate revenue being pitched to attract investment into technology to achieve climate change targets with recommendations made to address this based on the findings. In fact, an optimum level of storage exists which is dependent on demand and wind generation. The research in this thesis indicates this level to be between 200 MW and 300 MW. A report published in the year 2021 by the system operator stated an expected storage in Northern Ireland of 200 MW by 2030. Therefore, this expected storage rating needs revised based on the results of the research. The key recommendation is that the regulators and the grid operators urgently revisit the current schemes and restructure them otherwise we may have power quality and supply issues into the future as current fossil fuel, mainly gas generators are mothballed. },
note = {EThOS ID: uk.bl.ethos.854974},
keywords = {},
pubstate = {published},
tppubtype = {phdthesis}
}
Lejeune, Edgar
2022, (Histoire, Philosophie et Sociologie des sciences. Université de Paris / Université Paris Diderot (Paris 7)).
@phdthesis{Lejeune2022,
title = {Médiévistes et ordinateurs. Organisations collectives, pratiques des sources et conséquences historiographiques (1966-1990)},
author = {Edgar Lejeune},
url = {https://halshs.archives-ouvertes.fr/tel-03598652},
year = {2022},
date = {2022-03-05},
urldate = {2022-03-05},
abstract = {Dès la fin des années 1950, l'irruption des calculateurs électroniques dans les sciences humaines et sociales a profondément affecté les pratiques des chercheurs qui se sont saisis de ces nouveaux outils de classement et de calcul. Cette thèse vise à analyser certaines transformations historiographiques que ces innovations techniques ont provoquées, en se concentrant sur un large groupe d’historiens médiévistes mettant en œuvre ces instruments pour mener leurs recherches entre 1966 et 1990.
Mes problématiques s’organisent autour de deux préoccupations principales. Tout d’abord, ce travail s’interroge sur l’apparition de nouvelles formes d’organisation collective de la recherche, à l’échelle des équipes de recherche comme de la discipline elle-même. Ma thèse montre comment ces formes s’articulent à la production, à la manipulation et à la mise en circulation de nouveaux types de textes (bordereaux de saisies, cartes perforées, programmes informatiques, manuels de codage, mais également bulletin de liaison).
De plus, cette thèse se propose d’analyser les transformations des méthodes des historiens liées à l’utilisation des moyens électroniques. J’y mets en évidence que le recours aux calculateurs électroniques et aux ensembles de savoirs associés à leurs utilisations (analyse de données, analyse automatique de textes, informatique documentaire) impliquait l’emploi de technologies intellectuelles (matrices, graphes, listes, index, inventaires, thesaurus, etc...) qui requéraient une formalisation accrue des opérations de recherche des médiévistes, tout en étant dotées, dans ce contexte de fonctions originales.
Pour travailler à ces problématiques, la méthodologie développée dans ce travail repose sur deux convictions. Tout d’abord, j’y développe l’idée qu’il faut appliquer à l’histoire des sciences humaines et sociales les méthodes développées par les historiens
des sciences. Ensuite, celle qu’il est nécessaire, pour saisir les pratiques des historiens, d’étudier les textes sur lesquels reposent ces pratiques. Cette seconde direction nous a conduit à emprunter des méthodes de recherche à la linguistique, et en particulier à l’analyse de discours.
Cette thèse est ainsi construite en trois parties. Dans la première, je propose une analyse de deux projets de recherches menés par des médiévistes français entre 1966 et 1990, aux fins de comparer leurs organisations collectives (taille des équipes, présence d’informaticien, type de financement, outils de calculs employés), les influences extra-disciplinaires qu’ils subissent dans l’élaboration de leurs méthodes (démographie, géographie, linguistique, sociologie), mais aussi les méthodes qu’ils mettent en œuvre (lexicométrie, histoire quantitative) et les conséquences historiographiques de ces travaux.
Dans la deuxième partie de cette thèse, je traite des processus par lesquels certains collectifs engagés dans l’utilisation des ordinateurs se sont organisés à une échelle méta-collective, dans le but de faire circuler les produits de leurs recherches (éditions, bases de données, programmes informatiques, etc...) et des méthodes et des techniques qu’ils avaient pu développer au cours de leurs expériences respectives. L’analyse porte sur une initiative française, à portée européenne, qui démarre avec l’organisation d’un colloque à Rome en 1975 et se poursuit par la mise en œuvre d’une publication en 1979, intitulé Le Médiéviste et l’ordinateur. Ce bulletin de liaison devient, dès lors, l’un des vecteurs privilégiés de la circulation des méthodes et de la construction d’une culture scientifique commune.
La troisième et dernière partie est quant à elle consacrée aux modalités des échanges qui prennent forme dans les pages de ce bulletin de liaison. Deux directions sont explorées : 1) le genre d’article qui s’y développe en relation avec la nécessité de faire circuler de nouveaux types de connaissances techniques et 2) les difficultés qu’ont pu rencontrer les utilisateurs de ces méthodes dans le partage de ce type de savoir avec certains de leurs collègues, d’un point de vue technique, mais également épistémologique.},
note = {Histoire, Philosophie et Sociologie des sciences. Université de Paris / Université Paris Diderot (Paris 7)},
keywords = {},
pubstate = {published},
tppubtype = {phdthesis}
}
Mes problématiques s’organisent autour de deux préoccupations principales. Tout d’abord, ce travail s’interroge sur l’apparition de nouvelles formes d’organisation collective de la recherche, à l’échelle des équipes de recherche comme de la discipline elle-même. Ma thèse montre comment ces formes s’articulent à la production, à la manipulation et à la mise en circulation de nouveaux types de textes (bordereaux de saisies, cartes perforées, programmes informatiques, manuels de codage, mais également bulletin de liaison).
De plus, cette thèse se propose d’analyser les transformations des méthodes des historiens liées à l’utilisation des moyens électroniques. J’y mets en évidence que le recours aux calculateurs électroniques et aux ensembles de savoirs associés à leurs utilisations (analyse de données, analyse automatique de textes, informatique documentaire) impliquait l’emploi de technologies intellectuelles (matrices, graphes, listes, index, inventaires, thesaurus, etc...) qui requéraient une formalisation accrue des opérations de recherche des médiévistes, tout en étant dotées, dans ce contexte de fonctions originales.
Pour travailler à ces problématiques, la méthodologie développée dans ce travail repose sur deux convictions. Tout d’abord, j’y développe l’idée qu’il faut appliquer à l’histoire des sciences humaines et sociales les méthodes développées par les historiens
des sciences. Ensuite, celle qu’il est nécessaire, pour saisir les pratiques des historiens, d’étudier les textes sur lesquels reposent ces pratiques. Cette seconde direction nous a conduit à emprunter des méthodes de recherche à la linguistique, et en particulier à l’analyse de discours.
Cette thèse est ainsi construite en trois parties. Dans la première, je propose une analyse de deux projets de recherches menés par des médiévistes français entre 1966 et 1990, aux fins de comparer leurs organisations collectives (taille des équipes, présence d’informaticien, type de financement, outils de calculs employés), les influences extra-disciplinaires qu’ils subissent dans l’élaboration de leurs méthodes (démographie, géographie, linguistique, sociologie), mais aussi les méthodes qu’ils mettent en œuvre (lexicométrie, histoire quantitative) et les conséquences historiographiques de ces travaux.
Dans la deuxième partie de cette thèse, je traite des processus par lesquels certains collectifs engagés dans l’utilisation des ordinateurs se sont organisés à une échelle méta-collective, dans le but de faire circuler les produits de leurs recherches (éditions, bases de données, programmes informatiques, etc...) et des méthodes et des techniques qu’ils avaient pu développer au cours de leurs expériences respectives. L’analyse porte sur une initiative française, à portée européenne, qui démarre avec l’organisation d’un colloque à Rome en 1975 et se poursuit par la mise en œuvre d’une publication en 1979, intitulé Le Médiéviste et l’ordinateur. Ce bulletin de liaison devient, dès lors, l’un des vecteurs privilégiés de la circulation des méthodes et de la construction d’une culture scientifique commune.
La troisième et dernière partie est quant à elle consacrée aux modalités des échanges qui prennent forme dans les pages de ce bulletin de liaison. Deux directions sont explorées : 1) le genre d’article qui s’y développe en relation avec la nécessité de faire circuler de nouveaux types de connaissances techniques et 2) les difficultés qu’ont pu rencontrer les utilisateurs de ces méthodes dans le partage de ce type de savoir avec certains de leurs collègues, d’un point de vue technique, mais également épistémologique.
Technical Reports
2022
Green, Brandon; Pécoud, Antoine
How does the UN talk about human mobility? A textual analysis of narratives by IOM and UNHCR on migrants and refugees Technical Report
2022, ISBN: 1929-9915.
@techreport{Green2022,
title = {How does the UN talk about human mobility? A textual analysis of narratives by IOM and UNHCR on migrants and refugees},
author = {Brandon Green and Antoine Pécoud},
editor = {Anna Triandafyllidou and Usha George},
url = {https://www.torontomu.ca/content/dam/centre-for-immigration-and-settlement/tmcis/publications/workingpapers/2022_7_Green_Brandon_Pecoud_Antoine_How_does_the_UN_talk_about_human_mobility_A_textual_analysis_of_narratives_by_IOM_and_UNHCR_on_migrants_and_refugees.pdf},
isbn = {1929-9915},
year = {2022},
date = {2022-10-01},
urldate = {2022-10-01},
issuetitle = {Working Papers Series},
issue = {7},
abstract = {In the absence of a binding and coherent international migration regime, the global governance of migration relies on normative narratives produced by UN agencies and other intergovernmental processes, in line with the discursive legitimacy traditionally associated with international organizations. Such narratives impact migrants, asylum-seekers and refugees because they support certain policy frameworks among member states. Yet, global migration governance remains fragmented, especially as far as the long-standing divide between the International Organization for Migration (IOM) and the Office of the United Nations High Commissioner for Refugees (UNHCR) is concerned. This article contributes to this discussion by applying Corpus- Assisted Critical Discourse Analysis to the narratives produced by these two organizations. The article identifies some of the dominant worldviews in the narratives of IOM and UNHCR. Results show that IOM and UNHCR have distinct worldviews, associated with different textual patterns, and that, while IOM’s textual productions seem to influence UNHCR’s discourses, the opposite is less true. This would support the view that IOM is currently the leading actor in terms of framing migration, thereby exerting a strong influence on global migration governance.},
keywords = {},
pubstate = {published},
tppubtype = {techreport}
}
Workshops
2022
Villard, Lionel; Barbier, Marc
ANF TDM 2022 - Exploration documentaire et extraction d'information Workshop
2022.
@workshop{Villard2022,
title = {ANF TDM 2022 - Exploration documentaire et extraction d'information},
author = {Lionel Villard and Marc Barbier},
url = {https://anf-tdm-2022.sciencesconf.org/resource/page/id/6},
year = {2022},
date = {2022-10-03},
urldate = {2022-10-03},
abstract = {Entre 2014 et en juin 2021, plus de 450 auteurs dispersés à travers le monde ont fait confiance à CorText Manager pour alimenter un aspect de leurs travaux de recherche. Cela présente 10% de la communauté d'utilisateurs.
CorText Manager permet d'appréhender l'émergence de domaines de recherche et d'innovation, d'étudier des controverses et « hot topics », d'effectuer des cartographies socio-sémantiques des productions de la recherche (publications, brevets, projets), ainsi que d'analyser des contenus issus du web et des média-sociaux. Pour ce faire, plusieurs éléments de méthodes sont mobilisables : principalement issus de la linguistique computationnelle, de la scientométrie, de l'analyse des réseaux sociaux et de l'analyse géospatiale.
Cet atelier se propose de sensibiliser l'audience à certaines de ces méthodes tout en découvrant l'organisation et l'évolution de la production scientifique autour de la chloroquine et de l'hydroxychloroquine entre 2014 et 2020.},
keywords = {},
pubstate = {published},
tppubtype = {workshop}
}
CorText Manager permet d'appréhender l'émergence de domaines de recherche et d'innovation, d'étudier des controverses et « hot topics », d'effectuer des cartographies socio-sémantiques des productions de la recherche (publications, brevets, projets), ainsi que d'analyser des contenus issus du web et des média-sociaux. Pour ce faire, plusieurs éléments de méthodes sont mobilisables : principalement issus de la linguistique computationnelle, de la scientométrie, de l'analyse des réseaux sociaux et de l'analyse géospatiale.
Cet atelier se propose de sensibiliser l'audience à certaines de ces méthodes tout en découvrant l'organisation et l'évolution de la production scientifique autour de la chloroquine et de l'hydroxychloroquine entre 2014 et 2020.
NotesVIEW ALL
-
Long trends on twitter: intertemporal clusters combining hashtags and terms on Scientometrics, Altmetrics, Bibliometrics and Science Of Science
Long trends on twitter: inter-temporal clusters combining hashtags and terms, for all tweets on Scientometrics, Altmetrics, Bibliometrics and Science Of Science from Jan. 2017 to dec. 2021, on a semester base. Query used to extract tweets: lang:en (Scientometrics OR “ScienceOfScience” OR “Science Of Science” OR “Altmetrics” OR “altmetric” OR “bibliometrics” OR “bibliometric” OR “citation metrics” […]
-
Présenter CorTexT Manager en 2 minutes
Cortext Manager est une application web construite par des chercheurs et par des ingénieurs à destination de chercheurs en sciences humaines et sociales, au plus près des questions portées par les chercheurs qui nous entourent et par notre communauté d’utilisateurs. Cette application web peut produire un grand nombre d’analyses différentes qui ont trait aux champs […]
-
Analysis of the scientific production that mentioned the use of CorText Manager
There are two ways to understand what CorTexT Manager is. The first one is to look at what has been achieved in terms of methods, tools and therefore lines of code. The second one is studied below, by analyzing (here with CorTexT Manager) what academic users have published using… CorTexT Manager. Our study of the […]
-
10 years of CorText Manager v2
It took us more than 10 years to come with CorText Manager version 2 as it is now! Behind the scenes CorText Manager begun with a first version in 2009. More than thirty contributors has worked directly or indirectly on the two versions, year after year. All the ideas, inspirations, all this accumulation of pieces […]
-
RISIS Training: Thematic and spatial analysis of technologies using CorText Manager and RISIS patent database
One of the best CorText Manager training courses was organized and offered by the RISIS project. Here is the program of this training which lasted 3 days: Monday 08/11/21 14h-16h30: Session 1 Session 1a: Introduction on patent analysis (60’) Introductory lecture session • Welcoming introduction (Philippe Larédo) 5’ • Type of patents documents (Antoine Schoen) […]
-
Early 2021 CorText Manager training sessions
CorText organized a series of training workshops on CorText Manager and its methods in January 2021! These workshops were imagined as a staircase with three successive steps : Session 1: Introduction Session 2: Method comparisons Session 3: Research questions and work on user’s corpus For these sessions, the subject chosen for the demonstrations and exercises […]
-
Seminar and workshop during the Summer School of PPGCI IBICT UFRJ, Rio de Janeiro – 03/2020
In March 2020, the LabEx SITES post-doctoral researcher, Ale Abdo, traveled to Rio de Janeiro and São Paulo to organize two trainings on textual analysis and on a new method he developed and integrated at the CorText Infrastructure, as well as to participate in discussions on open and citizen science in Brazil, including the discussion […]
-
A CorText Manager distance training session in the framework of the nanocellulose project – Grenoble, June 2020
For complementing the RISIS access requested (to Leiden publications DB and RISIS patent DB) by the GAEL laboratory (UMR INRAE, CNRS, UGA, INPG), in the framework of a research project on nanocellulose, the CorText team has provided , in June and July 2020, an advanced training on the use of CorText. After setting up of […]
CorText Newsfeed
Want to stay up-to-date with the latest training sessions and developments in our methods and data? We invite you to subscribe to Cortext Newsfeed, our succint and researcher oriented quarterly newsletter.
Read the previous editions of our newsletter