Ciencias Sociales Computacionales, Big Data y Machine Learning. Un mapa de situación del giro computacional en las ciencias sociales

Estado de la inscripción
Cerrada

Agenda de cursado
2do cuatrimestre

Dedicación total (horas reloj)
30

Fechas de inicio y fin
05/10/2023 a 02/11/2023

Cupo de alumnos
Sin cupo

Tipos de certificación
* Curso virtual IDES

Inscripción

Cerrada

Equipo docente

Cuerpo Docente: Germán Rosati, Laia Domenech Burin, Florencia Piñeyrúa

Fundamentación

En la última década se ha producido un notable incremento en el volumen de información disponible para la investigación social. Las redes sociales, las tecnologías mobile, la “internet de las cosas” y todas aquellas fuentes que pueden englobarse en el impreciso término de big data son ejemplos de estas nuevas fuentes. Se ha hecho posible recopilar, almacenar y analizar grandes cantidades de datos sociales de diversas fuentes, como las redes sociales, los registros gubernamentales y los archivos históricos.

Han proliferado las formas de comunicación e interacción sustentadas en Internet, por lo que pasaron a estar digitalizadas buena parte de las interacciones sociales, económicas, políticas y culturales de millones de usuarios. De esta manera, se comenzaron a generar repositorios de datos masivos de interacciones entre personas en tiempo real y con un nivel de desagregación individual. Así, aparecieron nuevas clases de datos que se desviaban del típico formato estructurado, diseñado específicamente para las ciencias sociales tradicionales (por ejemplo, las encuestas). Esta apertura de nuevas fuentes ha ido acompañada de la creación de nuevas herramientas y técnicas de análisis de datos. Quizás el aprendizaje automático en sus diversas formas sea una de las herramientas más novedosas. El alcance de las CSC en esta etapa parece desbordar aquellas áreas iniciales.

Estas innovaciones técnicas y metodológicas permiten abordar preguntas y problemáticas clásicas de las ciencias sociales. En efecto, a partir de la generación de nuevas fuentes de datos y nuevas técnicas analíticas se hacen abordables preguntas que antes no lo eran o se habilitan nuevas formas de aproximarse a ellas. A su vez, es esperable que estos nuevos instrumentos sirvan para refinar tales interrogantes clásicos y, también, para generar nuevos problemas de investigación.

Muchas áreas del conocimiento científico se han beneficiado de la aplicación creativa de las fuentes y técnicas englobadas bajo el nombre de “Big Data” y “Machine Learning”. Sin embargo, las ciencias sociales argentinas no parecen haber hecho aún un uso extensivo de las mismas.

Este seminario propone una primera aproximación general a un campo disciplinar que se ha revitalizado como consecuencia de los procesos mencionados arriba: las ciencias sociales computacionales. Se propone como un primer mapeo de problemas y técnicas en este campo y su relación con algunas tareas y preguntas clásicas en las ciencias sociales.

Objetivos

El curso se propone que los asistentes:

● logren una primera aproximación a los problemas y discusiones epistemológicas y metodológicas acerca de la aplicación del machine learning en la actividad científica y las diferencias con el modelado estadístico tradicional

● incorporen fundamentos conceptuales del flujo de trabajo y de la metodología asociadas a estas técnicas

● identifiquen situaciones de aplicación de este tipo de modelos a problemas de investigación básica y aplicada

Destinatarios

Investigadorxs de UNTREF, doctorandxs y maestrandxs de cualquier ciclo formativo de posgrado de UNTREF, y becarixs e investigadorxs del CIS-CONICET/IDES-UNTREF.

Contenidos

Encuentro 1. Introducción. ¿Qué son las CSC? Big, medium y small data en las ciencias sociales. El giro computacional.

Encuentro 2. Aprendizaje automático y ciencias sociales. ¿Cómo construir tipologías (aprendizaje no supervisado)? ¿Se puede "predecir" en ciencias sociales (aprendizaje supervisado)?

Encuentro 3. Procesamiento de Lenguaje Natural Episodio 1. Modelado de tópicos. ¿Cómo detectar temas en un corpus?

Encuentro 4. Procesamiento de Lenguaje Natural Episodio 2. Transformers: detectando discurso de odio en redes sociales.

Encuentro 5. Procesamiento de Lenguaje Natural Episodio 3. Word Embeddings. ¿Se pueden analizar estereotipos culturales mediante un corpus de texto crudo?

Anderson, C. (2008). The End of Theory: The Data Deluge Makes the Scientific Method Obsolete. Wired, 06. https://www.wired.com/2008/06/pb-theory/
Blei, D. M. (2012). Probabilistic topic models. Communications of the ACM, 55(4), 77–84.
https://doi.org/10.1145/2133806.2133826
Breiman, L. (2001). Statistical Modeling: The Two Cultures (with comments and a rejoinder by the author). Statistical Science, 16(3). https://doi.org/10.1214/ss/1009213726
James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An introduction to statistical learning: With applications in R. Springer.
Kozlowski, A. C., Taddy, M., & Evans, J. A. (2019). The Geometry of Culture: Analyzing the Meanings of Class through Word Embeddings. American Sociological Review, 84(5), 905–949. https://doi.org/10.1177/0003122419877135
Lee, J. (2021). Transformers: A Primer [Class notes]. http://www.columbia.edu/~jsl2239/transformers.html
Nelson, L. K. (2020). Computational Grounded Theory: A Methodological Framework. Sociological Methods & Research, 49(1), 3–42. https://doi.org/10.1177/0049124117729703
Pérez, J. M., Luque, F. M., Zayat, D., Kondratzky, M., Moro, A., Serrati, P. S., Zajac, J., Miguel, P., Debandi, N., Gravano, A., & Cotik, V. (2023). Assessing the Impact of Contextual Information in Hate Speech Detection. IEEE Access, 11, 30575–30590. https://doi.org/10.1109/ACCESS.2023.3258973
Rosati, G. (2022). Procesamiento de Lenguaje Natural aplicado a las ciencias sociales. Detección de tópicos en letras de tango. Revista Latinoamericana de Metodología de la Investigación Social, 23, 38–60.
Rosati, G., Chazarreta, A., Domenech, L., Piñeyrúa, F., & Maguire, T. (2023). Ciencias Sociales Computacionales. Un estado de la cuestión y una agenda de investigación. Papeles de Trabajo, 17(30).
Satvika, Thada, V., & Singh, J. (2021). A Primer on Word Embedding. En I. Jeena Jacob, S. Kolandapalayam Shanmugam, S. Piramuthu, & P. Falkowski-Gilski (Eds.), Data Intelligence and Cognitive Informatics (pp. 525–541). Springer Singapore. https://doi.org/10.1007/978-981-15-8530-2_42
Stoltz, D. S., & Taylor, M. A. (2021). Cultural cartography with word embeddings. Poetics, 88, 101567. https://doi.org/10.1016/j.poetic.2021.101567

Modalidad de cursada

Virtual

Requisitos de admisión

Ser investigadorxs de UNTREF, doctorandxs y maestrandxs de cualquier ciclo formativo de posgrado de UNTREF, y becarixs e investigadorxs del CIS-CONICET/IDES-UNTREF.