Publicación:
Sistema de recomendación para mejorar la indexación de páginas web en el motor de búsqueda de Google

dc.audienceComunidad Científica y Académicaspa
dc.contributor.advisorBarco Santa, Andrés Felipe
dc.contributor.authorDuque Delgado, Juan Camilo
dc.contributor.authorHoyos Palma, Christian David
dc.date.accessioned2019-08-05T14:23:30Z
dc.date.available2019-08-05T14:23:30Z
dc.date.issued2019
dc.date.submitted2019-07-22
dc.description.abstractHypertext manages the way the web is organized. It allows the webpages to know how must be the elements organized visually and hierarchically. And mainly it defines the way the search engines classify and indexes the content. That process is called search engine optimization (SEO), and it’s often being not properly implemented, due to the inexperience in the area of web content creators. This project is focused on help these creators to improve its SEO in the Google’s search engine. To accomplish this it was designed and developed a recommender system that analyses the plain HTML (Its content, intention and tags) and helped out by artificial intelligence and data mining identifies patterns in the best indexed web pages by Google. This patterns are related with the main topic of the web page and its intention. The patterns and the correct implementation of Google’s SEO rules are considered to give user friendly recommendations in natural language to the user.eng
dc.description.abstractEl hipertexto es el sistema de organización más importante en la web. Este permite presentar datos y vincular fragmentos de texto, permitiendo al usuario relacionar contenido y encontrar los elementos más relevantes. Además, el hipertexto ayuda (por medio de etiquetas) a los motores de búsqueda, indexar y clasificar contenido (pequeños fragmentos de texto). Dado que muchos de los usuarios que crean contenido en la web no son expertos en optimización para motores de búsqueda, el proceso de indexación y clasificación no se ejecuta de la manera adecuada. Dichos usuarios desean que el contenido que crean sea visto por la mayor cantidad de personas posibles, y de ahí la importancia de tener una buena indexación de sus páginas web.Esta investigación ayuda mediante una aplicación web a los creadores de páginas web a mejorar la indexación de sus páginas web en el motor de búsqueda de Google. Para ayudar a mejorar la indexación de este contenido publicado, en esta tesis se diseñó y desarrolló un sistema de recomendación. Este sistema de recomendación analiza el documento HTML (sus etiquetas, el contenido y la intención), utiliza la inteligencia artificial en conjunto con la minería de datos para así de identificar algunos patrones que tienen las páginas web mejor indexadas relacionando el tema principal y la intención del contenido. Además, se analiza la correcta implementación de las reglas que brinda Google para la optimización. Así generando recomendaciones expresadas con lenguaje natural para el usuario final.spa
dc.formatpdfspa
dc.format.extent127 páginas: ilustracionesspa
dc.format.mediumRecurso en lineaspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.citationJ.C. Duque Delgado, y C.D. Hoyos Palma. “Sistema de recomendación para mejorar la indexación de páginas web en el motor de búsqueda de Google”. (Trabajo de grado Ingeniería Multimedia). Universidad de San Buenaventura Colombia, Facultad de Ingeniería, Cali, 2019.spa
dc.identifier.urihttp://hdl.handle.net/10819/7432
dc.language.isospaspa
dc.publisherUniversidad de San Buenaventuraspa
dc.publisher.facultyIngenieriasspa
dc.publisher.programIngeniería Multimediaspa
dc.publisher.sedeCalispa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.ccAtribución-NoComercial-SinDerivadas 2.5 Colombiaspa
dc.rights.licenciaPor medio de este formato manifiesto mi voluntad de AUTORIZAR a la Universidad de San Buenaventura, Sede Bogotá, Seccionales Medellín, Cali y Cartagena, la difusión en texto completo de manera gratuita y por tiempo indefinido en la Biblioteca Digital Universidad de San Buenaventura, el documento académico-investigativo objeto de la presente autorización, con fines estrictamente educativos, científicos y culturales, en los términos establecidos en la Ley 23 de 1982, Ley 44 de 1993, Decisión Andina 351 de 1993, Decreto 460 de 1995 y demás normas generales sobre derechos de autor. Como autor manifiesto que el presente documento académico-investigativo es original y se realiza sin violar o usurpar derechos de autor de terceros, por lo tanto, la obra es de mi exclusiva autora y poseo la titularidad sobre la misma. La Universidad de San Buenaventura no será responsable de ninguna utilización indebida del documento por parte de terceros y será exclusivamente mi responsabilidad atender personalmente cualquier reclamación que pueda presentarse a la Universidad. Autorizo a la Biblioteca Digital de la Universidad de San Buenaventura convertir el documento al formato que el repositorio lo requiera (impreso, digital, electrónico o cualquier otro conocido o por conocer) o con fines de preservación digital. Esta autorización no implica renuncia a la facultad que tengo de publicar posteriormente la obra, en forma total o parcial, por lo cual podrá, dando aviso por escrito con no menos de un mes de antelación, solicitar que el documento deje de estar disponible para el público en la Biblioteca Digital de la Universidad de San Buenaventura, así mismo, cuando se requiera por razones legales y/o reglas del editor de una revista.spa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/spa
dc.source.bibliographicCitationJ. Fernández, V. Gil-Costa, V. Ludueña, N. Reyes, P. Roggero y E. Chávez, «Indexación y Recuperación de Información Multimedia». C. Sáes, 2012. [En línea]. Available: http://www.lavanguardia.com/estilos-de-vida/20120719/54326650737/donde-estan-mis-datos.html. C. Du y L. Huang, «Text classification research with attention-based recurrent neural networks,» International J. of computers communications & control, Febrero 2018. L. Medsker y L. Jain, «Recurrent neural networks design and applications,» 2001. G. A. Betancourt, «Las máquinas de soporte vectorial (SVMs),» Scientia et Technica Año XI, vol. 27, Abril 2005. R. Salakhutdinov y G. Hinton, «Replicated Softmax: an Undirected Topic Model». [En línea]. Available: http://tcci.ccf.org.cn/conference/2014/. [En línea]. Available: https://www.reuters.com/. X. Huang, F. Peng, D. Schuurmans y N. Cercone, «Applying Machine Learning to Text Segmentation for Information Retrieval,» 2003. F. Dellaert, «The Expectation Maximization Algorithm,» College of Computing, Febrero 2002. Y. Doval, C. Gómez-Rodríguez y J. Vilares, «Segmentación de palabras en español mediante modelos del lenguaje basados en redes neuronales,» Procesamiento del Lenguaje Natural, vol. 57, 2016. D. J. Matich, «Redes Neuronales: Conceptos Básicos y Aplicaciones,» Marzo 2001. H. Zarzour, F. Maazouzi, M. Soltani y C. Chemam, «An Improved Collaborative Filtering Recommendation Algorithm for Big Data,» University of Souk Ahras. C. Insights, «The Value of Google Result Positioning,» 7 June 2013. D. P. Valcarce, «De Internet 0 a Web 3.0: un reto epistemológico para la comunidad universitaria,» Universidad Complutense de Madrid, 2008. N. Y. y. U. Köse, What is search engine optimization: SEO?, vol. 9, Procedia Social and Behavioral Sciences, 2010. P. Swati, P. B. y P. Ajay, «Search Engine Optimization: A Study,» Research Journal of Computer and Information Technology Sciences, vol. 1, Febrero 2013. A. R. Terrance, S. Shrivastava, A. Kumari y L. Sivanandam, «Competitive Analysis of Retail Websites through Search Engine Marketing,» 2018. J. Á. O. Varela, «Búsqueda eficaz de información en la web,» Universidad Nacional de La Plata, 2011. C. Ridings, «Everything you’ve always wanted to know about PageRank,» 2001. [En línea]. Available: https://msdn.microsoft.com/es-es/library/hh765981(v=vs.120).aspx . K. E. Wiegers, «First Things First: Prioritizing Requirements,» Software Development magazine, Septiembre 1999. [En línea]. Available: https://www.w3.org/TR/html52/. D. S. Naveiras, «Técnicas de indexación y recuperación de documentos utilizando referencias geográficas y textuales,» Septiembre 2009. M. Cutts. [En línea]. Available: https://www.youtube.com/watch?time_continue=103&v=BNHR6IQJGZs. [En línea]. Available: http://www.nintendolife.com/news/2018/04/sega_ages_is_officially_coming_to_nintendo_switch_in_the_west. [En línea]. Available: https://scholar.google.es/. J. D. D. Sampedro, «Estudio y aplicación de técnicas de aprendizaje automático orientadas al ámbito médico: estimación y explicación de predicciones individuales,» Junio 2012. [En línea]. Available: https://www.youtube.com/watch?v=qv6UVOQ0F44. G. E. Hinton, «Boltzmann machine,» Scholarpedia, 2007. [En línea]. Available: https://www.ibm.com/watson/. IBM, [En línea]. Available: https://www.techrepublic.com/article/ibm-watson-the-inside-story-of-how-the-jeopardy-winning-supercomputer-was-born-and-what-it-wants-to-do-next/. C. Todd, R. V. Pena y R. Srinivas, Evaluation of Artificial Intelligence Frameworks, SMU Scholar, 2018. R. High, «The Era of Cognitive Systems: An Inside Look at IBM Watson and How it Works,» 2012. K. Weigers y J. Beatty, «Software Requirements,» Microsoft Press, vol. 3, 2013. S. Cueva y M. Sucunuta, «Ingeniería de Requisitos,» 2014. K. Pohl, «Requirements Engineering,» Springer-Verlag Berlin Heidelberg, 2010. J. L. HERLOCKER, «Evaluating Collaborative Filtering Recommender Systems,» Oregon State University; University of Minnesota. R. Martínez, «Cómo mejorar la indexación de una web en Google,» Human Level, 16 Octubre 2017. [En línea]. Available: https://www.1and1.es/digitalguide/paginas-web/desarrollo-web/los-meta-tags-mas-importantes-y-su-funcion/. D. G. Macho, «La calidad de una página web como herramienta de comunicación,» Universidad Europea de Madrid, 23 Enero 2013. I. A. Larreina, «Posicionamiento en buscadores: una metodología práctica de optimización de sitios web,» El profesional de la información, Vols. %1 de %2v. 14-2, Marzo 2005. L. Codina y M. C. Marcos, «Posicionamiento web: conceptos y herramientas,» vol. 14, Marzo 2005. A. Diaz, «¿Qué es la etiqueta TITLE?,» metricspot, 15 Marzo 2013. Facebook, [En línea]. Available: https://reactjs.org/. A. Kumar y R. K. Singh, «COMPARATIVE ANALYSIS OF ANGULARJS AND REACTJS,» International Journal of Latest Trends in Engineering and Technology, vol. 7. Google, [En línea]. Available: https://material.io/. [En línea]. Available: https://material-ui.com/ [En línea]. Available: https://nodejs.org/es/. [En línea]. Available: https://www.npmjs.com/. [En línea]. Available: https://aws.amazon.com/es/. IBM, [En línea]. Available: https://www.ibm.com/watson/services/natural-language-understanding/. [En línea]. Available: https://developers.google.com/custom-search/. P. Beynon-Davies1, C. Carne1, H. Mackay2 y D. Tudhope1, «Rapid application development (RAD): An empirical review,» European Journal of Information Systems, 1999. J. M. G. Zea, «Implementando scrum + rad para la gestión y desarrollo de proyectos de software en equipos de trabajo con personal limitado y eventual,» Programación Matemática y Software, 2016.spa
dc.source.instnameUniversidad de San Buenaventura - Calispa
dc.source.otherCali, Trabajo de Grado, T005.13 D946sspa
dc.source.reponameBiblioteca Digital Universidad de San Buenaventuraspa
dc.subjectSistema de recomendaciónspa
dc.subjectFltrado de informaciónspa
dc.subjectIBM Watsonspa
dc.subjectInteligencia artificialspa
dc.subjectMinería de datosspa
dc.subjectSEOspa
dc.subjectIndexaciónspa
dc.subjectMotores de búsquedaspa
dc.subjectAplicaciones webspa
dc.subjectRecommender systemspa
dc.subjectInformation filteringspa
dc.subjectArtificial intelligencespa
dc.subjectData miningspa
dc.subjectIndexingspa
dc.subjectSearch enginespa
dc.subjectWeb appsspa
dc.subject.lembRecuperación de informaciónspa
dc.subject.lembBúsquedas en internetspa
dc.subject.lembIndexaciónspa
dc.thesis.nameIngeniero Multimediaspa
dc.titleSistema de recomendación para mejorar la indexación de páginas web en el motor de búsqueda de Googlespa
dc.typeTrabajo de grado - Pregradospa
dc.type.driverinfo:eu-repo/semantics/bachelorThesisspa
dc.type.hasVersioninfo:eu-repo/semantics/acceptedVersionspa
dc.type.spaTrabajo de Gradospa
dspace.entity.typePublicationspa
Archivos
Paquete original
Mostrando 1 - 1 de 1
Imagen en miniatura
Nombre:
Sistema_Indexacion_Google_Duque_2018.pdf
Tamaño:
4.47 MB
Formato:
Adobe Portable Document Format
Descripción:
Paquete de licencias
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
2.02 KB
Formato:
Item-specific license agreed upon to submission
Descripción: