Web Scraping de los Perfiles y Publicaciones de una Afiliación en Google Scholar utilizando Aplicaciones Web e implementando un Algoritmo en R
El objetivo de este artículo es hacer uso de la técnica Web Scraping para extraer datos de Google Scholar a través de diferentes métodos. El Web Scraping es una forma de minería de datos no estructurada, que permite extraer información de páginas web, escanear su código HTML y generar patrones de ex...
Autores Principales: | Murillo, Danny, Saavedra, Dalys |
---|---|
Formato: | Artículo |
Idioma: | Español |
Publicado: |
Universidad Tecnológica de Panamá
2017
|
Materias: | |
Acceso en línea: |
http://revistas.utp.ac.pa/index.php/memoutp/article/view/1465 |
id |
RepoUTP1689 |
---|---|
recordtype |
dspace |
spelling |
RepoUTP16892021-07-06T16:36:28Z Web Scraping de los Perfiles y Publicaciones de una Afiliación en Google Scholar utilizando Aplicaciones Web e implementando un Algoritmo en R Murillo, Danny Saavedra, Dalys Web Scraping, Google Scholar, Minería de datos, Lenguaje R, análisis de datos El objetivo de este artículo es hacer uso de la técnica Web Scraping para extraer datos de Google Scholar a través de diferentes métodos. El Web Scraping es una forma de minería de datos no estructurada, que permite extraer información de páginas web, escanear su código HTML y generar patrones de extracción de datos. El artículo muestra las pruebas realizadas de estos métodos para medir la velocidad de extracción de los datos y buscar la mejor forma de extraer los datos de GS de forma estructurada. El artículo también muestra el análisis y desarrollo de un algoritmo en el lenguaje R, para comparar la velocidad de extracción de los datos y la eficiencia en el formato de salida de los datos. 2017-07-25 info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion http://revistas.utp.ac.pa/index.php/memoutp/article/view/1465 spa http://revistas.utp.ac.pa/index.php/memoutp/article/view/1465/2111 http://revistas.utp.ac.pa/index.php/memoutp/article/view/1465/html info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/4.0/ application/pdf text/html Universidad Tecnológica de Panamá Memorias de Congresos UTP; 2017: 4to Congreso Internacional AmITIC 2017, Aplicando nuevas tecnologías; 8-15 |
institution |
Universidad Tecnológica de Panamá |
collection |
Repositorio UTP – Ridda2 |
language |
Español |
topic |
Web Scraping, Google Scholar, Minería de datos, Lenguaje R, análisis de datos |
spellingShingle |
Web Scraping, Google Scholar, Minería de datos, Lenguaje R, análisis de datos Murillo, Danny Saavedra, Dalys Web Scraping de los Perfiles y Publicaciones de una Afiliación en Google Scholar utilizando Aplicaciones Web e implementando un Algoritmo en R |
description |
El objetivo de este artículo es hacer uso de la técnica Web Scraping para extraer datos de Google Scholar a través de diferentes métodos. El Web Scraping es una forma de minería de datos no estructurada, que permite extraer información de páginas web, escanear su código HTML y generar patrones de extracción de datos. El artículo muestra las pruebas realizadas de estos métodos para medir la velocidad de extracción de los datos y buscar la mejor forma de extraer los datos de GS de forma estructurada. El artículo también muestra el análisis y desarrollo de un algoritmo en el lenguaje R, para comparar la velocidad de extracción de los datos y la eficiencia en el formato de salida de los datos. |
format |
Artículo |
author |
Murillo, Danny Saavedra, Dalys |
author_sort |
Murillo, Danny |
title |
Web Scraping de los Perfiles y Publicaciones de una Afiliación en Google Scholar utilizando Aplicaciones Web e implementando un Algoritmo en R |
title_short |
Web Scraping de los Perfiles y Publicaciones de una Afiliación en Google Scholar utilizando Aplicaciones Web e implementando un Algoritmo en R |
title_full |
Web Scraping de los Perfiles y Publicaciones de una Afiliación en Google Scholar utilizando Aplicaciones Web e implementando un Algoritmo en R |
title_fullStr |
Web Scraping de los Perfiles y Publicaciones de una Afiliación en Google Scholar utilizando Aplicaciones Web e implementando un Algoritmo en R |
title_full_unstemmed |
Web Scraping de los Perfiles y Publicaciones de una Afiliación en Google Scholar utilizando Aplicaciones Web e implementando un Algoritmo en R |
title_sort |
web scraping de los perfiles y publicaciones de una afiliación en google scholar utilizando aplicaciones web e implementando un algoritmo en r |
publisher |
Universidad Tecnológica de Panamá |
publishDate |
2017 |
url |
http://revistas.utp.ac.pa/index.php/memoutp/article/view/1465 |
_version_ |
1796209710021476352 |
score |
12.041087 |