{"id":5204,"date":"2024-02-03T09:20:20","date_gmt":"2024-02-03T16:20:20","guid":{"rendered":"https:\/\/www.regioncuatronoticias.com\/?p=5204"},"modified":"2024-02-03T09:20:22","modified_gmt":"2024-02-03T16:20:22","slug":"china-no-puede-comprar-gpu-asi-que-los-obligaron-a-innovar-ahora-preparan-modelos-de-aprendizaje-que-no-necesitan-hardware","status":"publish","type":"post","link":"https:\/\/www.regioncuatronoticias.com\/index.php\/2024\/02\/03\/china-no-puede-comprar-gpu-asi-que-los-obligaron-a-innovar-ahora-preparan-modelos-de-aprendizaje-que-no-necesitan-hardware\/","title":{"rendered":"China no puede comprar GPU as\u00ed que los obligaron a innovar: ahora preparan modelos de aprendizaje que no necesitan hardware"},"content":{"rendered":"\n<p><strong>Ciudad de M\u00e9xico a 3 de Febrero de 2024.-<\/strong> China busca entrenar modelos de lenguaje sin usar GPU.Los modelos de lenguaje de gran escala (LLM) son sistemas de inteligencia artificial que pueden generar diversos tipos de contenido, como texto, c\u00f3digo, im\u00e1genes, entre otros. Estos modelos requieren una gran cantidad de datos y recursos computacionales para ser entrenados, lo que representa un desaf\u00edo para China, que enfrenta limitaciones en el acceso a las GPU, clave para el entrenamiento de LLM.<\/p>\n\n\n\n<p>Sin embargo, las GPU son escasas y costosas en el mercado mundial debido a la alta demanda de diversos sectores, como los videojuegos, la miner\u00eda de criptomonedas y la investigaci\u00f3n cient\u00edfica. Adem\u00e1s, China est\u00e1 sujeta al control de exportaciones de Estados Unidos, que restringe el suministro de alta tecnolog\u00eda al pa\u00eds asi\u00e1tico, por motivos de seguridad nacional y competencia geopol\u00edtica.<\/p>\n\n\n\n<p>China y los LLM: \u00bfc\u00f3mo superar la censura, la regulaci\u00f3n y la escasez de GPU?<\/p>\n\n\n\n<p>Las restricciones de Estados Unidos no son el \u00fanico obst\u00e1culo, China tambi\u00e9n tiene que lidiar con la censura y regulaci\u00f3n de los datos y el contenido que se generan y difunden en su territorio, lo que puede afectar la calidad y diversidad de los LLM que se desarrollan en el pa\u00eds.<\/p>\n\n\n\n<p>Asimismo, China tiene que competir con otros pa\u00edses y empresas que tambi\u00e9n est\u00e1n avanzando en el campo de la IA generativa, como Estados Unidos, Jap\u00f3n, Corea del Sur, entre otros.<\/p>\n\n\n\n<p>Ante estos desaf\u00edos, China est\u00e1 buscando alternativas para entrenar LLM sin depender de las GPU. Una de ellas es el uso de modelos dispersos, que solo activan una peque\u00f1a parte de los par\u00e1metros del modelo, lo que los hace m\u00e1s eficientes y menos intensivos en recursos que los modelos densos, que activan todos los par\u00e1metros.<\/p>\n\n\n\n<p>Un ejemplo de un modelo disperso es Wu Dao 2.0, un modelo de IA generativa multimodal desarrollado por la Academia de Inteligencia Artificial de Beijing (BAAI), que tiene 1.75 billones de par\u00e1metros y puede generar lenguaje natural, c\u00f3digo, im\u00e1genes, y otros tipos de contenido.<\/p>\n\n\n\n<p>Algoritmos de Deep Learning, Wu Dao 2.0<\/p>\n\n\n\n<p>Otra alternativa es el uso de modelos de c\u00f3digo abierto que pueden ejecutarse en una sola m\u00e1quina, como GLM-130B, un modelo denso con 130 billones de par\u00e1metros que puede generar lenguaje natural y c\u00f3digo.<\/p>\n\n\n\n<p>GLM-130B se basa en ChatGPT-3, un popular LLM desarrollado por OpenAI, pero usa un tokenizador diferente y un conjunto de datos de entrenamiento diferente. GLM-130B puede lograr una calidad comparable a ChatGPT-3 en algunas tareas de generaci\u00f3n de lenguaje, como la resumen y la traducci\u00f3n.<\/p>\n\n\n\n<p>China impulsa los modelos de lenguaje de la IA con un nuevo est\u00e1ndar<\/p>\n\n\n\n<p>En cuanto a censura y regulaci\u00f3n de datos nacional, China ya ha tomado otras medidas. Seg\u00fan TechWireAsia, en la Conferencia Mundial de Inteligencia Artificial (WAIC) celebrada en Shangh\u00e1i, China present\u00f3 su nueva entidad para regular los grandes modelos de lenguaje, que son la clave para crear chatbots de IA como ChatGPT. Para ello, cont\u00f3 con la colaboraci\u00f3n de los gigantes tecnol\u00f3gicos Baidu, Huawei, 360 Security Technology y Alibaba, que lideran un grupo de trabajo para definir el est\u00e1ndar LLM.<\/p>\n\n\n\n<p>Tras una etapa de control riguroso, China apuesta por la integraci\u00f3n de la IA en todos los sectores y la sociedad. Seg\u00fan el South China Morning Post, en los \u00faltimos seis meses, el pa\u00eds ha aprobado 40 LLM y aplicaciones de IA, de las cuales 14 recibieron el visto bueno esta semana. As\u00ed, el pa\u00eds asi\u00e1tico est\u00e1 promoviendo un cambio radical en su pol\u00edtica de IA y modelos de lenguaje grande, alentando a su poblaci\u00f3n y a sus peque\u00f1as industrias a adoptar y aprovechar estas tecnolog\u00edas.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Ciudad de M\u00e9xico a 3 de Febrero de 2024.- China busca entrenar modelos de lenguaje sin usar GPU.Los modelos de lenguaje de gran escala (LLM) son sistemas de inteligencia artificial que pueden generar diversos tipos de contenido, como texto, c\u00f3digo, im\u00e1genes, entre otros. Estos modelos requieren una gran cantidad de datos y recursos computacionales para [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":5205,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"content-type":"","footnotes":""},"categories":[18],"tags":[],"class_list":{"0":"post-5204","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-tecnologia"},"_links":{"self":[{"href":"https:\/\/www.regioncuatronoticias.com\/index.php\/wp-json\/wp\/v2\/posts\/5204","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.regioncuatronoticias.com\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.regioncuatronoticias.com\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.regioncuatronoticias.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.regioncuatronoticias.com\/index.php\/wp-json\/wp\/v2\/comments?post=5204"}],"version-history":[{"count":1,"href":"https:\/\/www.regioncuatronoticias.com\/index.php\/wp-json\/wp\/v2\/posts\/5204\/revisions"}],"predecessor-version":[{"id":5206,"href":"https:\/\/www.regioncuatronoticias.com\/index.php\/wp-json\/wp\/v2\/posts\/5204\/revisions\/5206"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.regioncuatronoticias.com\/index.php\/wp-json\/wp\/v2\/media\/5205"}],"wp:attachment":[{"href":"https:\/\/www.regioncuatronoticias.com\/index.php\/wp-json\/wp\/v2\/media?parent=5204"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.regioncuatronoticias.com\/index.php\/wp-json\/wp\/v2\/categories?post=5204"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.regioncuatronoticias.com\/index.php\/wp-json\/wp\/v2\/tags?post=5204"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}