CCNA 200-301

CCNP Enterprise

CCNP Security

CCIE Enterprise Lab

CCIE Security Lab

CCNP Service Provider

CCNP Data Center

CCNP Collaboration

CCIE DC Lab

IA + Nacional + Gratis + Open Source + Poderosa

DeepSeek es una empresa tecnológica china especializada en Inteligencia Artificial General (IAG), que se centra en el desarrollo y la aplicación de grandes modelos.DeepSeek-R1 es su modelo de razonamiento de código abierto, que destaca en la gestión de tareas complejas y está disponible para uso comercial gratuito.

DeepSeek AI

¿Qué puede hacer DeepSeek?

Generación de texto

  • Generación estructurada: Tablas, listas (por ejemplo, horarios, recetas)
  • Redacción de documentos: Comentarios de código, documentación
  • Escritura creativa: Artículos, historias, poesía, contenido de marketing, contenido para redes sociales, guiones, etc.
  • Resumen y reescritura: Resúmenes de textos largos (artículos, informes), simplificación de texto, traducción y localización multilingüe

Comprensión y análisis del lenguaje natural

  • Razonamiento de conocimiento: Resolución de problemas lógicos (matemáticas, razonamiento común), análisis causal (correlación de eventos)
  • Análisis semántico: Análisis de sentimiento (reseñas, comentarios), reconocimiento de intenciones (servicio al cliente, consultas de usuario), extracción de entidades (nombres, ubicaciones, eventos)
  • Clasificación de texto: Etiquetado de temas (por ejemplo, categorización de noticias), detección de contenido de spam

Tareas relacionadas con la programación y el código

  • Generación y finalización de código: Fragmentos de código (Python, JavaScript), finalización automática con comentarios
  • Depuración de código: Análisis de errores y sugerencias de reparación, consejos para la optimización del rendimiento
  • Documentación técnica: Documentación de API, explicación y generación de ejemplos de código

Dibujo convencional

  • (No se menciona explícitamente, pero se implica a través de las capacidades generales)

Descarga del PDF de DeepSeek de principiante a maestro (Universidad Tsinghua)

¿Cómo utilizar DeepSeek?

Acceso:https://chat.deepseek.com

De principiante a maestro:¿Cómo puedes utilizar la IA mejor y más eficazmente cuando todos pueden usarla?

Modelos de razonamiento

  • Ejemplo: DeepSeek-R1, GPT-3 destacan en razonamiento lógico, razonamiento matemático y resolución de problemas en tiempo real.

Los modelos de razonamiento son aquellos que mejoran las capacidades de razonamiento, análisis lógico y toma de decisiones sobre los modelos de gran tamaño tradicionales. A menudo incorporan tecnologías adicionales como aprendizaje reforzado, razonamiento neuro-simbólico y aprendizaje meta para fortalecer sus habilidades de razonamiento y resolución de problemas.Los modelos no de razonamiento son adecuados para la mayoría de las tareas. Los modelos generales generalmente se centran en la generación de lenguaje, la comprensión del contexto y el procesamiento del lenguaje natural, sin enfatizar capacidades de razonamiento profundo. Estos modelos suelen comprender los patrones de lenguaje a través del entrenamiento con grandes cantidades de datos de texto y pueden generar contenido apropiado, pero carecen de las habilidades de razonamiento complejo y toma de decisiones de los modelos de razonamiento.

Comparación de dimensiones

DimensiónModelo de razonamientoModelo general
FortalezasDerivación matemática, análisis lógico, generación de código, descomposición de problemas complejosGeneración de texto, escritura creativa, diálogo de múltiples turnos, preguntas abiertas
DebilidadesTareas divergentes (por ejemplo, creación de poesía)Tareas que requieren cadenas lógicas estrictas (por ejemplo, pruebas matemáticas)
Esencia del rendimientoSe especializa en tareas de alta densidad lógicaDestaca en tareas de alta diversidad
Juicio de fortalezaNo es universalmente más fuerte, pero significativamente mejor en sus dominios de entrenamiento objetivoMás flexible en escenarios generales, pero requiere ingeniería de prompts para compensar las capacidades

Ejemplos de modelos

  • GPT-3, GPT-4 (OpenAI), BERT (Google): Principalmente utilizados para generación de lenguaje, comprensión del lenguaje, clasificación de texto, traducción, etc.

Pensamiento rápido vs. pensamiento lento

  • Modelos de reacción rápida (por ejemplo, ChatGPT-4): Respuesta rápida, bajo costo computacional, basado en predicción probabilística a través de entrenamiento con grandes datos
  • Modelos de pensamiento lento (por ejemplo, OpenAI-1): Respuesta lenta, alto costo computacional, basado en razonamiento en cadena de pensamiento para resolver problemas paso a paso
  • Toma de decisiones: Los modelos de reacción rápida se basan en algoritmos y reglas preestablecidos, mientras que los modelos de pensamiento lento pueden tomar decisiones de manera autónoma basadas en análisis en tiempo real
  • Creatividad: Los modelos de reacción rápida están limitados al reconocimiento de patrones y optimización, mientras que los modelos de pensamiento lento pueden generar nuevas ideas y soluciones
  • Interacción humana: Los modelos de reacción rápida siguen guiones preestablecidos y luchan con las emociones y las intenciones humanas, mientras que los modelos de pensamiento lento pueden interactuar de manera más natural y comprender emociones y intenciones complejas
  • Resolución de problemas: Los modelos de reacción rápida se distinguen en problemas estructurados y bien definidos, mientras que los modelos de pensamiento lento pueden manejar problemas multidimensionales y no estructurados, proporcionando soluciones creativas
  • Problemas éticos: Los modelos de reacción rápida como herramientas controladas tienen pocas preocupaciones éticas, mientras que los modelos de pensamiento lento suscitan discusiones sobre autonomía y control

Si estás apasionado por el campo de la IA y te estás preparando para los exámenes de certificación de AWS o Microsoft, SPOTO tiene materiales de estudio completos y prácticos listos para ti. Ya sea que estés preparándote para la certificación en Machine Learning de AWS (MLA-C01), la certificación de Practicante de IA (AIF-C01) o los exámenes relacionados con IA de Microsoft (AI-900, AI-102), los materiales de certificación que ofrezco te ayudarán a estudiar de manera eficiente y aumentarán tus posibilidades de aprobar.Haz clic en los enlaces a continuación para obtener los últimos volcados de exámenes y guías de estudio detalladas que te ayudarán a aprobar los exámenes y alcanzar nuevas alturas en la industria de la IA:

Al alcanzar estas certificaciones, no solo mejorarás tus habilidades, sino que también te destacarás en el lugar de trabajo y abrirás más oportunidades. ¡Actúa ahora y domina el futuro de la IA!

Cadena de pensamiento en cadena (CoT)

La aparición de la cadena de pensamiento en cadena (CoT) divide los grandes modelos en dos categorías: modelos de “predicción probabilística (reacción rápida)” y modelos de “pensamiento en cadena (pensamiento lento)”. El primero es adecuado para retroalimentación rápida y tareas inmediatas, mientras que el último resuelve problemas complejos a través del razonamiento. Comprender sus diferencias ayuda a elegir el modelo adecuado para la tarea y obtener los mejores resultados.

Diferencias en la estrategia de prompts

  • Modelos de razonamiento: Los prompts deben ser concisos, centrarse directamente en el objetivo y los requisitos de la tarea (ya que la lógica de razonamiento está internalizada). Evita la guía paso a paso, ya que puede limitar las capacidades del modelo.
  • Modelos generales: Los prompts necesitan guiar explícitamente los pasos de razonamiento (por ejemplo, a través de prompts de CoT), de lo contrario, el modelo puede omitir la lógica clave. Confía en la ingeniería de prompts para compensar las deficiencias de capacidad.

Principios clave

  1. Selección de modelo: Elige según el tipo de tarea, no según la popularidad del modelo (por ejemplo, modelos de razonamiento para tareas matemáticas, modelos generales para tareas creativas).
  2. Diseño de prompts:
    • Modelos de razonamiento: Utiliza instrucciones concisas, centrándote en el objetivo y confiando en las capacidades de razonamiento internalizadas del modelo. (“Simplemente di lo que quieres.”)
    • Modelos generales: Utiliza guía estructurada y compensatoria. (“Completa lo que falta.”)
  3. Evitar errores:
    • No utilices prompts heurísticos (por ejemplo, interpretación de roles) con modelos de razonamiento, ya que puede interferir con su línea lógica principal.
    • No confíes en exceso en los modelos generales (por ejemplo, preguntando directamente preguntas de razonamiento complejo); en cambio, verifica los resultados paso a paso.

De “dar instrucciones” a “expresar necesidades”

Tipos de estrategia

Tipo de estrategiaDefinición y objetivoEscenarios aplicablesEjemplo (para modelos de razonamiento)Ventajas y riesgos
Impulsado por instruccionesProporcionar directamente pasos claros o requisitos de formatoTareas simples, ejecución rápida“Escribe una función de ordenación rápida en Python con comentarios.”✅ Resultados precisos y eficientes✕ Limita el espacio de optimización del modelo
Orientado a la demandaDescribir el contexto del problema y los objetivos, dejar que el modelo planifique la soluciónProblemas complejos, razonamiento autónomo del modelo“Optimiza el proceso de inicio de sesión del usuario analizando los cuellos de botella actuales y proponiendo 3 soluciones.”✅ Estimula el razonamiento profundo del modelo✕ Necesidad de definir claramente las fronteras de la demanda
Modo híbridoCombinar la descripción del problema con las restricciones claveEquilibrar flexibilidad y controlabilidad“Diseña un plan de viaje de 3 días para Hangzhou, incluyendo el Lago Occidental y el Templo Lingyin, con un presupuesto de 2000 yuanes.”✅ Equilibra objetivos y detalles✕ Evitar sobre-restricciones
Preguntas heurísticasGuiar al modelo a pensar activamente a través de preguntas (por ejemplo, “por qué”, “cómo”)Problemas exploratorios, lógica explicativa del modelo“¿Por qué elegir descenso de gradiente para este problema de optimización? Compara con otros algoritmos.”✅ Provoca la capacidad de auto-explicación del modelo✕ Puede desviarse de los objetivos principales

Demanda de tarea y estrategia de prompt

Tipo de tareaModelo aplicableEnfoque del promptEjemplo (prompt efectivo)Prompts a evitar
Demostración matemáticaModelo de razonamientoPregunta directa, sin guía paso a paso“Demuestra el teorema de Pitágoras”Descomposición redundante (por ejemplo, “Primero dibuja un diagrama, luego enumera las fórmulas”)
Escritura creativaModelo de razonamientoFomentar la divergencia, establecer roles/estilos“Escribe una aventura en el estilo de Hemingway”Sobre-restricción lógica (por ejemplo, “Enumera los pasos en orden cronológico”)
Generación de códigoModelo de razonamientoNecesidades concisas, confiar en la lógica del modelo“Implementa quicksort en Python”Guía paso a paso (por ejemplo, “Primero escribe la función recursiva”)
Diálogo de múltiples turnosModelo generalInteracción natural, sin instrucciones estructuradas“¿Qué piensas sobre el futuro de la inteligencia artificial?”Cadenas lógicas forzadas (por ejemplo, “Responde en tres puntos”)
Análisis lógicoModelo de razonamientoPlantear problemas complejos directamente“Analiza el conflicto entre utilitarismo y deontología en el problema del tranvía”Agregar guía subjetiva (por ejemplo, “¿Qué crees que es mejor?”)
Modelo generalModelo generalDescomponer problemas, preguntar paso a paso“Primero explica el problema del tranvía, luego compara las dos perspectivas éticas”Pregunta única de lógica compleja

Cómo expresar necesidades a la IA

Tipo de demandaCaracterísticasFórmula de expresión de demandaEstrategia de adaptación para modelo de razonamientoEstrategia de adaptación para modelo general
Toma de decisionesNecesidad de ponderar opciones, evaluar riesgos, elegir la mejor soluciónObjetivo + Opciones + Criterios de evaluaciónSolicitar deducción lógica y análisis cuantitativoSugerencias directas, confiar en la experiencia del modelo
AnalíticoNecesidad de comprender profundamente datos/información, descubrir patrones o relaciones causalesProblema + Datos/Información + Método de análisisProvocar deducción de cadena causal y validación de hipótesisResumen superficial o clasificación
CreativoNecesidad de generar contenido novedoso (texto/diseño/solución)Tema + Estilo/Restricciones + Dirección de innovaciónCombinar marco lógico para generar creatividad estructuradaAsociación libre, confiar en la guía de ejemplos
VerificaciónNecesidad de verificar la consistencia lógica, la confiabilidad de los datos o la viabilidad de la soluciónConclusión/Solución + Método de verificación + Puntos de riesgoDiseñar independientemente el camino de verificación e identificar contradiccionesConfirmación simple, falta de deducción profunda
EjecuciónNecesidad de completar operaciones específicas (código/cálculo/proceso)Tarea + Restricciones de paso + Formato de salidaOptimizar pasos de manera autónoma, equilibrar eficiencia y correcciónSeguir estrictamente las instrucciones, sin optimización autónoma

Ejemplos de prompts

Demanda de toma de decisiones:“Se disponen dos opciones para reducir los costos logísticos:① Construir un almacén regional (alta inversión inicial, bajos costos a largo plazo)② Asociarse con un tercero (pago por uso, alta flexibilidad)Por favor, utiliza el modelo de cálculo de ROI para comparar los costos totales durante 5 años y recomendar la solución óptima.

Demanda de verificación:“Aquí hay una conclusión de un artículo: ‘El modelo de red neuronal A es superior al método tradicional B.’Por favor, verifica:① Si los datos experimentales respaldan esta conclusión;② Revisa si existe algún sesgo en la configuración del grupo de control;③ Recalcula el valor p y determina su significancia.

Demanda analítica:“Analiza los datos de ventas de vehículos eléctricos nuevos de los últimos tres años (adjunto CSV) y explica:① La correlación entre las tendencias de crecimiento y la política;② Predice la cuota de mercado en 2025 utilizando el modelo ARIMA y explica la base para la selección de parámetros.

Demanda de ejecución:“Convierte el siguiente código C a Python, con los siguientes requisitos:① Mantén la misma complejidad temporal;② Utiliza numpy para optimizar las operaciones de matrices;③ Proporciona el código completo con casos de prueba de tiempo.

Demanda creativa:“Diseña un producto para el hogar inteligente que aborde los problemas de seguridad de las personas mayores que viven solas, combinando redes de sensores y advertencias tempranas de IA. Proporciona tres diferentes esbozos de rutas técnicas con explicaciones.

Demanda de verificación:“Aquí hay una conclusión de un artículo: ‘El modelo de red neuronal A es superior al método tradicional B.’Por favor, verifica:① Si los datos experimentales respaldan esta conclusión;② Revisa si existe algún sesgo en la configuración del grupo de control;③ Recalcula el valor p y determina su significancia.”


¿Aún necesitamos aprender prompts?

Prompts son las instrucciones o información que los usuarios ingresan en un sistema de IA para guiarla a generar salidas específicas o realizar tareas específicas. En términos simples, los prompts son el lenguaje que utilizamos para “conversar” con la IA. Pueden ser una simple pregunta, una instrucción detallada o una descripción de tarea compleja.Un prompt consta de tres elementos básicos:

  • Instrucción (Instrucción): El núcleo del prompt, que le dice explícitamente a la IA qué tarea realizar.
  • Contexto (Contexto): Proporciona información de fondo para ayudar a la IA a comprender y ejecutar mejor la tarea.
  • Expectativa (Expectativa): Expresa claramente o implícitamente los requisitos y expectativas para la salida de la IA.

Tipos de prompts

  • Prompts instructivos: Indican directamente a la IA qué tarea realizar.
  • Prompts de pregunta-respuesta: Plantean preguntas a la IA, esperando respuestas correspondientes.
  • Prompts de interpretación de roles: Exigen que la IA asuma un rol específico y simule un escenario particular.
  • Prompts creativos: Guiar a la IA para realizar escritura creativa o generación de contenido.
  • Prompts analíticos: Exigen que la IA analice y razonar sobre la información proporcionada.
  • Prompts multimodales: Combinan texto, imágenes y otras formas de entrada.

La esencia de los prompts

CaracterísticaDescripciónEjemplo
Puente de comunicaciónConecta la intención humana con la comprensión de la IA“Traduce lo siguiente al francés: Hola, mundo”
Proveedor de contextoProporciona información de fondo necesaria para la IA“Suponiendo que eres un historiador del siglo XIX, comenta el ascenso de Napoleón”
Definidor de tareaEspecifica claramente la tarea que la IA debe completar“Escribe una introducción para un artículo sobre el cambio climático, 200 palabras”
Formador de salidaInfluye en la forma y contenido de la salida de la IA“Explica la mecánica cuántica en términos sencillos, como si hablaras con un niño de 10 años”
Guía de capacidad de IAGuía a la IA a utilizar habilidades o capacidades específicas“Utiliza tus habilidades de escritura creativa para crear una breve historia sobre viaje en el tiempo”

Artículo de:Equipo:

Yu Menglong, Investigador postdoctoralEscuela de Periodismo y Comunicación, Universidad TsinghuaCentro de Investigación de Nuevos Medios, Laboratorio de Cultura del Metaverso

Please follow and like us:
Last modified: February 13, 2025

Author

Comments

Write a Reply or Comment

Your email address will not be published.