Descripción: Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos

Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos

El objetivo de este artículo es hacer uso de la técnica Web Scraping para extraer datos de Google Scholar (GS)a través de diferentes métodos. El Web Scraping es una forma de minería de datos no estructurada, que permite extraer información de páginas web, escanear su código HTML y generar patrones d...

Descripción completa

Autores Principales:	Murillo, Danny, Saavedra, Dalys, Quintero, Erika
Formato:	Artículo
Idioma:	Español
Publicado:	Universidad Tecnológica de Panamá 2018
Materias:	Web Scraping, Google Scholar, minería de datos, lenguaje R, análisis de datos.
Acceso en línea:	http://revistas.utp.ac.pa/index.php/id-tecnologico/article/view/1807 https://doi.org/10.33412/idt.v14.1.1807 http://ridda2.utp.ac.pa/handle/123456789/4932

Sumario:	El objetivo de este artículo es hacer uso de la técnica Web Scraping para extraer datos de Google Scholar (GS)a través de diferentes métodos. El Web Scraping es una forma de minería de datos no estructurada, que permite extraer información de páginas web, escanear su código HTML y generar patrones de extracción de datos. Además, con el fin de realizar un análisis más profundo, se creó un algoritmo en el lenguaje R para comparar la velocidad de extracción de los datos y la eficiencia en el formato de salida de los datos. El artículo muestra las pruebas realizadas de estos métodos para medir la velocidad de extracción de los datos y buscar la mejor forma de extraer los datos de GS de forma estructurada.

Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos

Ejemplares similares