{"id":23782,"date":"2025-01-28T22:23:32","date_gmt":"2025-01-29T05:23:32","guid":{"rendered":"https:\/\/www.regioncuatronoticias.com\/?p=23782"},"modified":"2025-01-28T22:23:35","modified_gmt":"2025-01-29T05:23:35","slug":"que-es-deepseek-la-nueva-ia-china-que-ocupa-la-primera-posicion-en-la-app-store","status":"publish","type":"post","link":"https:\/\/www.regioncuatronoticias.com\/index.php\/2025\/01\/28\/que-es-deepseek-la-nueva-ia-china-que-ocupa-la-primera-posicion-en-la-app-store\/","title":{"rendered":"\u00bfQu\u00e9 es DeepSeek? La nueva IA china que ocupa la primera posici\u00f3n en la App Store"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\"><\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Seg\u00fan afirman, el modelo \u201csupera a otros modelos de c\u00f3digo abierto y logra un rendimiento comparable al de los principales modelos de c\u00f3digo cerrado\u201d.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Tomado de Aristegui Noticias<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Redacci\u00f3n AN \/ GER<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Martes 28 de enero de 2025<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">El asistente DeepSeek lleg\u00f3 a App Store el pasado 11 de enero y desde entonces, ha escalado hasta ocupar la primera posici\u00f3n en la tienda de Apple en Estados Unidos, por delante de ChatGPT, de OpenAI; un hito para una aplicaci\u00f3n que apenas acaba de llegar al mercado y que compite con el \u2018chatbot\u2019 m\u00e1s popular desde hace m\u00e1s de dos a\u00f1os.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>\u00bfQu\u00e9 es DeepSeek?<\/strong><\/p>\n\n\n\n<p class=\"wp-block-paragraph\">DeepSeek es un asistente de inteligencia artificial (IA) generativa que la firma china del mismo nombre lanz\u00f3 el pasado 11 de enero en la App Store, donde se ofrece bajo una modalidad de uso gratuito. Adem\u00e1s de responder preguntas en un formato conversacional, puede navegar por la web para ofrecer respuestas actualizadas, resumir documentos de texto de manera r\u00e1pida y utilizar el razonamiento para resolver problemas complejos.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">En su base se encuentra el modelo DeepSeek V3, que se lanz\u00f3 en diciembre. Este ha sido entrenado con 671,000 millones de par\u00e1metros con arquitectura Mixture of Experts (MoE), que divide un modelo de IA en peque\u00f1as redes neuronales para que act\u00faen de forma separada como si fueran distintos expertos.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Dispone tambi\u00e9n de 37,000 millones de par\u00e1metros activados para cada token, como explican sus responsable en el repositorio de GitHub. Y sus responsables han recurrido al mecanismo de atenci\u00f3n latente multicabezal (MLA) para \u201clograr una inferencia eficiente y una capacitaci\u00f3n rentable\u201d.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">La compa\u00f1\u00eda tecnol\u00f3gica ha empleado 14.8 billones de tokens \u201cdiversos y de alta calidad\u201d junto con un ajuste supervisado y aprendizaje de refuerzo por fases. Aseguran, adem\u00e1s, que cada token ha requerido para su entrenamiento 3.7 d\u00edas con 2,048 GPU Nvidia H800, lo que hace que el entrenamiento total alcance los 2,788 millones de horas de GPU y un coste total de 5,576 millones de d\u00f3lares.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Seg\u00fan afirman, el modelo \u201csupera a otros modelos de c\u00f3digo abierto y logra un rendimiento comparable al de los principales modelos de c\u00f3digo cerrado\u201d. As\u00ed, en la evaluaci\u00f3n de la comprensi\u00f3n del lenguaje (MMLU Pro) en una variedad de tareas, DeepSeek V3 alcanza una puntuaci\u00f3n de 75.9 frente al 78.0 de Claude 3.5 Sonnet, el 72.6 de GPT 4o y el 73.3 de Llama 3.1 405B.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">En la evaluaci\u00f3n de la capacidad para responder preguntas complejas de nivel posgrado (GPAQ Diamond), DeepSeek V3 ha obtenido una puntuaci\u00f3n de 59.1, por debajo de Claude 3.5 Sonnet (65.0), pero por encima de GPT 4o (49.9), Qwen 2.5 de 72B (49.0) y Llama 3.1 405B (51.1).<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Tambi\u00e9n queda en segunda posici\u00f3n en el an\u00e1lisis de la capacidad para resolver problemas de software del mundo real (SWE), en el que alcanza una puntuaci\u00f3n de 42.0, frente a los 50.8 de Claude 3.5 Sonnet, seguidos de GPT 4o (38.8), Llama 3.1 405B (24.5) y Qwen 2.5 de 72B (23.8).<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">En cambio, sobre sale en las pruebas de resoluci\u00f3n de desaf\u00edos (MATH 500), donde obtiene 90.2, mientras que Claude 3.5 Sonnet alcanza 78.9; Qwen 2.5 de 72B, 80.0; GPT 4o, 74.6, y Llama 3.1 405B, 73.8 puntos. Tambi\u00e9n lo hace en la resoluci\u00f3n de problemas matem\u00e1ticos con AIME 2024, con una puntuaci\u00f3n de 39.2, seguido de Qwen 2.5 de 72B y Llama 3.1 405B (ambos 23.3), Claude 3.5 Sonnet (16.0) y GPT 4o (9.3).<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">En programaci\u00f3n, en la prueba Codeforces, DeepSeek V3 alcanza 51.6 puntos, Qwen 2.5 de 72B , 24.8; Llama 3.1 405B, 25.3 puntos; GPT 4o23.6; y Claude 3.5 Sonnet, una puntuaci\u00f3n de 20.3.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Nuevos modelos de razonamiento<\/strong><\/p>\n\n\n\n<p class=\"wp-block-paragraph\">La semana pasada, la compa\u00f1\u00eda china present\u00f3 una nueva familia de modelos de razonamiento, DeepSeek-R1-Zero y DeepSeek-R1, el primero de ellos entrenado a trav\u00e9s del aprendizaje de refuerzo a gran escala sin ajuste fino supervisado como paso preliminar, como explica en el texto de la investigaci\u00f3n publicado en Arxiv.org.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">En el segundo, en cambio, se han empleado tambi\u00e9n un entrenamiento en m\u00faltiples fases y datos de inicio fr\u00edo antes del aprendizaje de refuerzo para sortear los problemas de legibilidad y mezcla de idiomas. Gracias a ello, sus desarrolladores aseguran que alcanza un rendimiento en tareas de razonamiento comparable a OpenAI o1.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">\u201cNuestro objetivo es explorar el potencial de los LLM [modelos de lenguaje de gran tama\u00f1o] para desarrollar capacidades de razonamiento sin ning\u00fan dato supervisado, centr\u00e1ndonos en su autoevoluci\u00f3n a trav\u00e9s de un proceso de aprendizaje de refuerzo puro\u201d, explican.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><a href=\"https:\/\/aristeguinoticias.com\/270125\/dinero-y-economia\/que-es-deepseek-la-nueva-ia-china-que-ocupa-la-primera-posicion-en-la-app-store\">https:\/\/aristeguinoticias.com\/270125\/dinero-y-economia\/que-es-deepseek-la-nueva-ia-china-que-ocupa-la-primera-posicion-en-la-app-store<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Seg\u00fan afirman, el modelo \u201csupera a otros modelos de c\u00f3digo abierto y logra un rendimiento comparable al de los principales modelos de c\u00f3digo cerrado\u201d. Tomado de Aristegui Noticias Redacci\u00f3n AN \/ GER Martes 28 de enero de 2025 El asistente DeepSeek lleg\u00f3 a App Store el pasado 11 de enero y desde entonces, ha escalado [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":23783,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"content-type":"","footnotes":""},"categories":[7,2],"tags":[],"class_list":["post-23782","post","type-post","status-publish","format-standard","has-post-thumbnail","category-internacional","category-negocios"],"_links":{"self":[{"href":"https:\/\/www.regioncuatronoticias.com\/index.php\/wp-json\/wp\/v2\/posts\/23782","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.regioncuatronoticias.com\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.regioncuatronoticias.com\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.regioncuatronoticias.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.regioncuatronoticias.com\/index.php\/wp-json\/wp\/v2\/comments?post=23782"}],"version-history":[{"count":1,"href":"https:\/\/www.regioncuatronoticias.com\/index.php\/wp-json\/wp\/v2\/posts\/23782\/revisions"}],"predecessor-version":[{"id":23784,"href":"https:\/\/www.regioncuatronoticias.com\/index.php\/wp-json\/wp\/v2\/posts\/23782\/revisions\/23784"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.regioncuatronoticias.com\/index.php\/wp-json\/wp\/v2\/media\/23783"}],"wp:attachment":[{"href":"https:\/\/www.regioncuatronoticias.com\/index.php\/wp-json\/wp\/v2\/media?parent=23782"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.regioncuatronoticias.com\/index.php\/wp-json\/wp\/v2\/categories?post=23782"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.regioncuatronoticias.com\/index.php\/wp-json\/wp\/v2\/tags?post=23782"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}