{"id":1788,"date":"2024-07-22T12:28:43","date_gmt":"2024-07-22T12:28:43","guid":{"rendered":"https:\/\/citt-humanidadesdigitales.madrimasd.org\/?p=1788"},"modified":"2024-08-05T08:39:49","modified_gmt":"2024-08-05T08:39:49","slug":"la-innovacion-tecnologica-aplicada-a-la-linguistica-y-sus-implicaciones-eticas-en-un-sector-emergente-protagonizan-el-curso-de-verano-del-ciit-en-hd-y-te","status":"publish","type":"post","link":"https:\/\/citt-humanidadesdigitales.madrimasd.org\/index.php\/2024\/07\/22\/la-innovacion-tecnologica-aplicada-a-la-linguistica-y-sus-implicaciones-eticas-en-un-sector-emergente-protagonizan-el-curso-de-verano-del-ciit-en-hd-y-te\/","title":{"rendered":"La innovaci\u00f3n tecnol\u00f3gica aplicada a la ling\u00fc\u00edstica y sus implicaciones \u00e9ticas en un sector emergente protagonizan el curso de verano del CIIT en HD y TE"},"content":{"rendered":"\n<p><\/p>\n\n\n\n<p><strong>El Cl\u00faster de Humanidades Digitales y Tecnolog\u00edas del Espa\u00f1ol re\u00fane a importantes figuras de la ling\u00fc\u00edstica computacional en el curso <em>Avances en tecnolog\u00edas del lenguaje para la sociedad del siglo XXI<\/em> en los Cursos de Verano de el Escorial.<\/strong><\/p>\n\n\n\n<p>Los Cursos de Verano de la Universidad Complutense de Madrid (UCM) en San Lorenzo del Escorial acogieron entre el 17 y el 19 de julio de 2024 el curso \u201cAvances en tecnolog\u00edas del lenguaje para la sociedad del siglo XXI\u201d organizado por el Cl\u00faster de Innovaci\u00f3n Tecnol\u00f3gica y Talento de Humanidades Digitales y Tecnolog\u00edas del Espa\u00f1ol de la Comunidad de Madrid (CIIT en HD y TE) que ha contado con importantes figuras de este \u00e1mbito.<\/p>\n\n\n\n<p>El mi\u00e9rcoles 17 de junio tuvo lugar la presentaci\u00f3n del curso de la mano de Raquel L\u00e1zaro Guti\u00e9rrez, profesora de la Universidad de Alcal\u00e1 de Henares y directora del CITT, as\u00ed como del curso de verano. A continuaci\u00f3n, el reconocido experto internacional en Procesamiento del Lenguaje Natural y Ling\u00fc\u00edstica Computacional, <a href=\"https:\/\/www.linkedin.com\/in\/ruslan-mitkov-a610652\/\">Ruslan Mitkov<\/a> ofreci\u00f3 la magistral ponencia <em>Natural Language Processing in the Artificial Intelligence Era: the Wind of Change is Blowing<\/em>.&nbsp;<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"768\" height=\"1024\" src=\"https:\/\/citt-humanidadesdigitales.madrimasd.org\/wp-content\/uploads\/2024\/07\/Curso-de-verano-CITT-HD-y-TE-2-768x1024.jpg\" alt=\"\" class=\"wp-image-1797\" srcset=\"https:\/\/citt-humanidadesdigitales.madrimasd.org\/wp-content\/uploads\/2024\/07\/Curso-de-verano-CITT-HD-y-TE-2-768x1024.jpg 768w, https:\/\/citt-humanidadesdigitales.madrimasd.org\/wp-content\/uploads\/2024\/07\/Curso-de-verano-CITT-HD-y-TE-2-225x300.jpg 225w, https:\/\/citt-humanidadesdigitales.madrimasd.org\/wp-content\/uploads\/2024\/07\/Curso-de-verano-CITT-HD-y-TE-2-1152x1536.jpg 1152w, https:\/\/citt-humanidadesdigitales.madrimasd.org\/wp-content\/uploads\/2024\/07\/Curso-de-verano-CITT-HD-y-TE-2.jpg 1200w\" sizes=\"auto, (max-width: 768px) 100vw, 768px\" \/><\/figure>\n\n\n\n<p><strong>El desarrollo tecnol\u00f3gico al servicio de la ling\u00fc\u00edstica<\/strong><\/p>\n\n\n\n<p>Se centr\u00f3 especialmente en el uso de la IA generativa, el aprendizaje profundo y los Modelos de lenguaje extenso (LLM). Para ilustrarlo, expuso diferentes casos de estudio, as\u00ed como herramientas como ChatGPT. Mitkov, profesor de la Universidad de Lancaster, ha sido reconocido por sus logros profesionales y de investigaci\u00f3n con el t\u00edtulo de Doctor Honoris Causa en la Universidad de Plovdiv (2011), en la Universidad Veliko Tarnovo (2014) y en la Nueva Universidad B\u00falgara de Sof\u00eda (2022).<\/p>\n\n\n\n<p>Por la tarde, Amelia Sanz, vicedecana de Digitalizaci\u00f3n y Pr\u00e1cticas en la Facultad de Filolog\u00eda de la Universidad Complutense de Madrid (UCM), moder\u00f3 la mesa redonda <em>Innovaci\u00f3n y nuevos mercados para las tecnolog\u00edas del espa\u00f1ol<\/em>. Estuvo acompa\u00f1ada por Cristina Aranda Guti\u00e9rrez, CEO en BIG ONION; Nieves \u00c1balos Serrano, cofundadora y CPO en MONOCEROS, Raquel Richi,n fundadora y CEO en Langoo.io; e Irene Cid Vega, Business Technology Lead en IBM.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"768\" src=\"https:\/\/citt-humanidadesdigitales.madrimasd.org\/wp-content\/uploads\/2024\/07\/Curso-de-verano-CITT-HD-y-TE-Mesa-Redonda-1_2-1024x768.jpg\" alt=\"\" class=\"wp-image-1791\" srcset=\"https:\/\/citt-humanidadesdigitales.madrimasd.org\/wp-content\/uploads\/2024\/07\/Curso-de-verano-CITT-HD-y-TE-Mesa-Redonda-1_2-1024x768.jpg 1024w, https:\/\/citt-humanidadesdigitales.madrimasd.org\/wp-content\/uploads\/2024\/07\/Curso-de-verano-CITT-HD-y-TE-Mesa-Redonda-1_2-300x225.jpg 300w, https:\/\/citt-humanidadesdigitales.madrimasd.org\/wp-content\/uploads\/2024\/07\/Curso-de-verano-CITT-HD-y-TE-Mesa-Redonda-1_2-768x576.jpg 768w, https:\/\/citt-humanidadesdigitales.madrimasd.org\/wp-content\/uploads\/2024\/07\/Curso-de-verano-CITT-HD-y-TE-Mesa-Redonda-1_2-1536x1152.jpg 1536w, https:\/\/citt-humanidadesdigitales.madrimasd.org\/wp-content\/uploads\/2024\/07\/Curso-de-verano-CITT-HD-y-TE-Mesa-Redonda-1_2.jpg 1600w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>El debate estuvo protagonizado por la evoluci\u00f3n que est\u00e1 experimentando el mercado espa\u00f1ol en el campo de la ling\u00fc\u00edstica, as\u00ed como los perfiles emergentes para las tecnolog\u00edas del espa\u00f1ol. No fue casualidad que en esta mesa compuesta enteramente por mujeres se hablara a de la paulatina feminizaci\u00f3n del \u00e1mbito tecnol\u00f3gico. Compartieron sus experiencias y enfoques con una implicada audiencia que se interes\u00f3 especialmente por la aplicaci\u00f3n de la Inteligencia Artificial a la ling\u00fc\u00edstica.<\/p>\n\n\n\n<p><strong>Lenguaje claro, empat\u00eda y \u00e9tica en un entorno en pleno desarrollo<\/strong><\/p>\n\n\n\n<p>El lenguaje claro abri\u00f3 la segunda de las jornadas del curso de verano. El jueves 18 de julio, Antonio Mart\u00edn, CEO en CALAMO y Sara Pistola, investigadora de la Universidad Nacional a Distancia (UNED) ofrecieron sendas ponencias sobre la importancia de la divulgaci\u00f3n del lenguaje claro y el uso de las nuevas tecnolog\u00edas para avanzar en el desarrollo del lenguaje claro, respectivamente.<\/p>\n\n\n\n<p>En primer lugar, en <em>Lenguaje claro: el fin del \u201csiempre se ha hecho as\u00ed\u201d<\/em> Mart\u00edn explic\u00f3 los inicios del lenguaje claro y su evoluci\u00f3n legislativa tanto a nivel nacional e internacional, desde las primeras demandas ciudadanas en Noruega hasta las grandes protestas en Espa\u00f1a a ra\u00edz del fraude de las preferentes en 2014, que supuso un punto de inflexi\u00f3n para que las empresas se comprometieran a implantar pol\u00edticas de lenguaje claro. Como conclusi\u00f3n, Mart\u00edn cerr\u00f3 su exposici\u00f3n con la idea de que \u00abel lenguaje claro no es otra cosa que empat\u00eda: Conocer al interlocutor para adaptar el mensaje\u00bb<\/p>\n\n\n\n<p>Pistola tom\u00f3 el relevo de algunas de las reflexiones planteadas por Mart\u00edn en torno a la aplicaci\u00f3n de la tecnolog\u00eda en el lenguaje claro. En concreto, hizo un repaso del desarrollo del procesamiento del lenguaje natural (PLN) y su utilidad a la hora de impulsar el lenguaje claro. Finalmente, tambi\u00e9n destac\u00f3 el impulso que ha experimentado gracias al desarrollo de modelos de <a href=\"https:\/\/www.linkedin.com\/feed\/hashtag\/?keywords=ia&amp;highlightedUpdateUrns=urn%3Ali%3Aactivity%3A7219665490221113344\">IA<\/a> generativa y mostr\u00f3 diferentes herramientas que facilitan la preparaci\u00f3n o adaptaci\u00f3n de textos de \u00e1mbitos especializados, como el sistema arText.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"768\" height=\"1024\" src=\"https:\/\/citt-humanidadesdigitales.madrimasd.org\/wp-content\/uploads\/2024\/07\/Curso-de-verano-CITT-HD-y-TE-Jueves-4-768x1024.jpg\" alt=\"\" class=\"wp-image-1793\" srcset=\"https:\/\/citt-humanidadesdigitales.madrimasd.org\/wp-content\/uploads\/2024\/07\/Curso-de-verano-CITT-HD-y-TE-Jueves-4-768x1024.jpg 768w, https:\/\/citt-humanidadesdigitales.madrimasd.org\/wp-content\/uploads\/2024\/07\/Curso-de-verano-CITT-HD-y-TE-Jueves-4-225x300.jpg 225w, https:\/\/citt-humanidadesdigitales.madrimasd.org\/wp-content\/uploads\/2024\/07\/Curso-de-verano-CITT-HD-y-TE-Jueves-4-1152x1536.jpg 1152w, https:\/\/citt-humanidadesdigitales.madrimasd.org\/wp-content\/uploads\/2024\/07\/Curso-de-verano-CITT-HD-y-TE-Jueves-4.jpg 1200w\" sizes=\"auto, (max-width: 768px) 100vw, 768px\" \/><\/figure>\n\n\n\n<p>Tras un breve descanso, fue el turno de Doaa Samy Khalil Shawer, profesora de la UCM, que adem\u00e1s de introducir aspectos de car\u00e1cter t\u00e9cnico en torno a los paradigmas del lenguaje computacional, como el entrenamiento y la evaluaci\u00f3n de modelos, profundiz\u00f3 en importantes consideraciones \u00e9ticas, sociales y legales con relaci\u00f3n al uso de la tecnolog\u00eda y de los datos.<\/p>\n\n\n\n<p>En este sentido, plante\u00f3 interesantes reflexiones, desde la pertinencia de determinados sesgos en contextos espec\u00edficos (por ejemplo, el sexo o la edad en investigaci\u00f3n sanitaria) a la corriente que demanda una IA verde que tenga en cuenta la huella de carbono en su propio desarrollo para reducir la contaminaci\u00f3n que generan los superordenadores debido al elevado consumo energ\u00e9tico.<\/p>\n\n\n\n<p><strong>Los corpus Ling\u00fc\u00edsticos: de la industria a la representaci\u00f3n social<\/strong><strong><\/strong><\/p>\n\n\n\n<p>Salvador Ros profesor de la UNED moder\u00f3 una mesa redonda centradas en otro de los temas fundamentales del curso: los corpus ling\u00fc\u00edsticos. Cont\u00f3 con la presencia de Carlos Mil\u00e1n Figueredo, Sr. Solutions Architect en AWS; Alicia D\u00edaz S\u00e1nchez, Sr. Computational Linguist en Minsait; y Guillermo L\u00f3pez Gallego, subdirector general de Fomento del Espa\u00f1ol en el Mundo en el Ministerio de Asuntos Exteriores, Uni\u00f3n Europea y Cooperaci\u00f3n de Espa\u00f1a.<\/p>\n\n\n\n<p>D\u00edaz S\u00e1nchez explic\u00f3 el&nbsp;ciclo del dato en proyectos de procesamiento de lenguaje natural en la aplicaci\u00f3n pr\u00e1ctica en la industria. Mil\u00e1n Figueredo, destac\u00f3 la importancia de la calidad de los datos, por encima incluso de la calidad del modelo de IA generativa, y mostr\u00f3 herramientas que permiten generar recursos basados en <a href=\"https:\/\/www.linkedin.com\/feed\/hashtag\/?keywords=ia&amp;highlightedUpdateUrns=urn%3Ali%3Aactivity%3A7219731691467116546\">IA<\/a> incluso a personas sin formaci\u00f3n t\u00e9cnica. Por su parte, L\u00f3pez Gallego, habl\u00f3 sobre la importancia de garantizar la representaci\u00f3n del espa\u00f1ol y las lenguas cooficiales en los corpus ling\u00fc\u00edsticos. En este sentido, hizo hincapi\u00e9 en la relevancia de generar corpus m\u00e1s extensos, bien etiquetados y de mayor calidad para poder diferenciar las variantes del espa\u00f1ol.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"768\" src=\"https:\/\/citt-humanidadesdigitales.madrimasd.org\/wp-content\/uploads\/2024\/07\/Curso-de-verano-CITT-HD-y-TE-Jueves-8-tarde-1024x768.jpg\" alt=\"\" class=\"wp-image-1794\" srcset=\"https:\/\/citt-humanidadesdigitales.madrimasd.org\/wp-content\/uploads\/2024\/07\/Curso-de-verano-CITT-HD-y-TE-Jueves-8-tarde-1024x768.jpg 1024w, https:\/\/citt-humanidadesdigitales.madrimasd.org\/wp-content\/uploads\/2024\/07\/Curso-de-verano-CITT-HD-y-TE-Jueves-8-tarde-300x225.jpg 300w, https:\/\/citt-humanidadesdigitales.madrimasd.org\/wp-content\/uploads\/2024\/07\/Curso-de-verano-CITT-HD-y-TE-Jueves-8-tarde-768x576.jpg 768w, https:\/\/citt-humanidadesdigitales.madrimasd.org\/wp-content\/uploads\/2024\/07\/Curso-de-verano-CITT-HD-y-TE-Jueves-8-tarde-1536x1152.jpg 1536w, https:\/\/citt-humanidadesdigitales.madrimasd.org\/wp-content\/uploads\/2024\/07\/Curso-de-verano-CITT-HD-y-TE-Jueves-8-tarde.jpg 1600w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>El encargado de cerrar el curso de verano el viernes 19 de julio fue el propio Ros. En <em>Novedades y \u00faltimos avances de las tecnolog\u00edas del lenguaje y la inteligencia artificial <\/em>hizo un repaso de los principales temas tratados a lo largo de la formaci\u00f3n. As\u00ed concluyen tres d\u00edas de experiencias compartidas, nuevos aprendizajes y un largo camino por recorrer en un sector en amplio desarrollo.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>El Cl\u00faster de Humanidades Digitales y Tecnolog\u00edas del Espa\u00f1ol re\u00fane a importantes figuras de la ling\u00fc\u00edstica computacional en el curso Avances en tecnolog\u00edas del lenguaje para la sociedad del siglo XXI en los Cursos de Verano de el Escorial. Los Cursos de Verano de la Universidad Complutense de Madrid (UCM) en San Lorenzo del Escorial acogieron entre el 17 y el 19 de julio de 2024 el curso \u201cAvances en tecnolog\u00edas del lenguaje para la sociedad del siglo XXI\u201d organizado por el Cl\u00faster de Innovaci\u00f3n Tecnol\u00f3gica y Talento de Humanidades Digitales y Tecnolog\u00edas del Espa\u00f1ol de la Comunidad de Madrid\u2026<\/p>\n","protected":false},"author":4,"featured_media":1762,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[9,11,10],"tags":[],"class_list":["post-1788","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-proyecto-corpus-anotado-multimodal","category-proyectos-flagship-formacion","category-proyectos-lenguaje-claro"],"blocksy_meta":"","acf":[],"jetpack_sharing_enabled":true,"jetpack_featured_media_url":"https:\/\/citt-humanidadesdigitales.madrimasd.org\/wp-content\/uploads\/2024\/02\/AVANCE1.png","_links":{"self":[{"href":"https:\/\/citt-humanidadesdigitales.madrimasd.org\/index.php\/wp-json\/wp\/v2\/posts\/1788","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/citt-humanidadesdigitales.madrimasd.org\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/citt-humanidadesdigitales.madrimasd.org\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/citt-humanidadesdigitales.madrimasd.org\/index.php\/wp-json\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/citt-humanidadesdigitales.madrimasd.org\/index.php\/wp-json\/wp\/v2\/comments?post=1788"}],"version-history":[{"count":6,"href":"https:\/\/citt-humanidadesdigitales.madrimasd.org\/index.php\/wp-json\/wp\/v2\/posts\/1788\/revisions"}],"predecessor-version":[{"id":1800,"href":"https:\/\/citt-humanidadesdigitales.madrimasd.org\/index.php\/wp-json\/wp\/v2\/posts\/1788\/revisions\/1800"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/citt-humanidadesdigitales.madrimasd.org\/index.php\/wp-json\/wp\/v2\/media\/1762"}],"wp:attachment":[{"href":"https:\/\/citt-humanidadesdigitales.madrimasd.org\/index.php\/wp-json\/wp\/v2\/media?parent=1788"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/citt-humanidadesdigitales.madrimasd.org\/index.php\/wp-json\/wp\/v2\/categories?post=1788"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/citt-humanidadesdigitales.madrimasd.org\/index.php\/wp-json\/wp\/v2\/tags?post=1788"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}