ChatGPT: La Inteligencia Artificial que Conquistó a Millones
Descubre cómo ChatGPT revolucionó la interacción digital y se convirtió en una herramienta disruptiva e indispensable en diversos sectores, marcando un antes y un después en la conversación con IA
Aunque la inteligencia artificial generativa no es nueva, ha sido la empresa OpenAI, la que ha conseguido captar el interés mundial por esta tecnología. Y ha sido gracias a sus logros y avances tecnológicos, con modelos como GPT-3, DALL-E y ChatGPT. Por todo ello, para reflexionar sobre cuál será el futuro de la IA generativa, es importante entender la historia y trayectoria de los productos de esta compañía.
OpenAI fue fundada en San Francisco en 2015 como una organización sin ánimo de lucro por un grupo de inversionistas e ingenieros liderados por Elon Musk y Sam Altman. De hecho, surgió como respuesta directa a las crecientes preocupaciones sobre el desarrollo que se estaba llevando a cabo alrededor de la IA, un desarrollo que podría resultar, según sus propios fundadores, en usos no éticos o peligrosos de esta tecnología.
Por ello fue creada bajo el firme objetivo de desarrollar tecnologías de inteligencia artificial de manera segura y responsable, lanzándose con el compromiso de ayudar a la humanidad, poniendo el foco en aprovechar los beneficios potenciales que la IA podría aportar a la sociedad global.
No obstante, en 2018 Musk decidió abandonar el proyecto por distintos enfrentamientos con la junta directiva, tras lo que Altman procedió a transformar OpenAI en una empresa de “beneficios limitados” y a buscar desde esta nueva posición nuevos inversores.
¡Prepárense para lo que viene!
Estamos festejando el aniversario de nuestra comunidad FuturIA con una serie de emocionantes novedades que he preparado especialmente para ustedes, los valiosos miembros de esta creciente comunidad. Pronto lanzaremos oficialmente una colección de ebooks con beneficios exclusivos diseñados pensando en ustedes.
¡Manténganse atentos!
Así, en 2019 la compañía firmó una alianza con Microsoft para el desarrollo y la comercialización de sus productos. Y, como resultado, ese mismo año Microsoft procedió a invertir 1.000 millones de dólares en forma de créditos informáticos, a cambio de un determinado papel en la futura comercialización de sus tecnologías. No obstante, el objetivo principal del gigante era desarrollar su oferta en la nube, donde compite con Google (Alphabet) y Amazon.
Y no fue el único desembolso de dinero hecho por Microsoft. Desde entonces, esta empresa ha invertido miles de millones de dólares en OpenAI, lo que ha permitido a la compañía aumentar su equipo y acelerar su investigación.
De hecho, en enero de 2023, Microsoft anunció “una inversión de varios miles de millones de dólares durante varios años”. En concreto, podríamos estar hablando de 10.000 millones de dólares, según distintos medios estadounidenses, lo que se dirigirá a hacer aún más fuerte tanto el posicionamiento de la compañía como el de sus productos de IA.
Desarrollo de Productos de OpenAI
Estos han sido los principales hitos alcanzados por la organización desde un punto de vista de producto, aunque no los únicos:
El Pionero GPT-1:
La publicación del primer modelo de lenguaje de OpenAI tuvo lugar en 2015 y fue bautizado como GPT-1. Para su entrenamiento se utilizaron repositorios como BookCorpus, una gran colección de libros electrónicos que cuenta con más de 11.000 libros en inglés, seleccionados de una amplia variedad de géneros y estilos literarios. Entre otras muchas cosas, GPT-1 era capaz de responder a preguntas, de generar texto creativo (poemas, historias, guiones…), de elaborar resúmenes o de hacer traducciones automáticas.
La Versión Mejorada GPT-2:
Cuatro años más tarde llegó GPT-2, un modelo de lenguaje más complejo que su predecesor, dado que contaba con un vocabulario mucho más avanzado. Mientras que GPT-1 se limitaba a un vocabulario de 50.000 palabras, GPT-2 contaba con uno más de cien veces mayor. Era el resultado de años de entrenamiento con nuevas fuentes de datos, entre las que se incluían además más de ocho millones de páginas web.
Del Texto a la Imagen con DALL-E:
Link de acceso: https://openai.com/dall-e-2
En 2019 tiene lugar igualmente un nuevo hito, dado que fue el año en el que la compañía lanzó DALL-E, un modelo de IA capaz de generar imágenes a partir de descripciones textuales. Entre sus aplicaciones se encuentra la posibilidad de usarlo para generar prototipos visuales de productos nuevos, aunque una de sus grandes aplicaciones es su utilización para la generación de memes. Por cierto, no puede generar imágenes de personas reales ni tampoco lo hace con contenido violento o ilegal.
Del Texto a la Programación con CODEX:
Link de acceso: https://openai.com/blog/openai-codex
Un año después OpenAI procedió al lanzamiento de Codex, un modelo de IA preparado para traducir lenguaje natural a código de computadora, siendo capaz de hacerlo para una amplia variedad de lenguajes de programación, incluyendo Python, JavaScript, C++ y Java. No obstante, sus aplicaciones van más allá, dado que también puede ayudar a solucionar problemas de programación, sugiriendo soluciones posibles, de forma que, para muchos, no se trata de una amenaza para los desarrolladores sino de una herramienta de mucha utilidad.
Y LLega GPT-3, Todavía Mejor que los Anteriores:
Ese año 2020 también tuvo lugar el lanzamiento de GPT-3, una nueva versión de su herramienta que se había entrenado con más de 45 terabytes de datos de fuentes como textos web, libros, Wikipedia y Common Crawl, un rastreador de la web que proporciona libremente sus archivos y conjuntos de datos al público. Por cierto, estos datos eran extraídos de internet gracias a la infraestructura informática de Microsoft, su reciente aliado estratégico.
El salto de calidad frente a sus predecesores se muestra con claridad en su vocabulario, de 175.000 millones de palabras, lo que permitía generar textos de gran complejidad y riqueza, con una precisión y fluidez comparables, para muchos, a la de un escritor humano.
¡Otra de nuestras sorpresas por nuestro aniversario!
Este aniversario es un nuevo punto de inflexión en nuestro proyecto FuturIA. Estén atentos a lo que se viene
La Disrupción de ChatGPT
Link de acceso: https://chat.openai.com/
Y así llegamos a noviembre del 2022, momento en el que la compañía lanza ChatGPT, un modelo de lenguaje abierto al público, inicialmente disponible de forma gratuita. Esto provocó que alcanzase los diez millones de usuarios diarios en menos de cuarenta días.
Es decir, contó con la entrada media de un millón de usuarios nuevos al día, una cifra espectacular teniendo en cuenta que TikTok, que también tuvo una entrada récord, lo consiguió con una media de 83.333 usuarios nuevos cada día.
Un éxito que explica que esta tecnología se utilice en la actualidad, entre otros lugares, en centros de atención al cliente para responder a preguntas y resolver problemas, en el sector educativo para aprender de forma más efectiva y, por supuesto, en todo tipo de empresas para agilizar la generación de contenido y ganar productividad.
ChatGPT – La IA Que lo Consiguió
En definitiva, ya sabemos qué fue lo que marcó el gran hito de la IA generativa y también cómo llegamos hasta ahí. Pero ¿entiendes bien qué es lo que hace que esta tecnología sea tan poderosa? ¿Sabes cuál es la razón por la que resulta tan disruptiva? ¿Y su mecanismo de funcionamiento?
ChatGPT utiliza la arquitectura Transformer, una red neuronal profunda que revolucionó el procesamiento del lenguaje natural (PLN). Así que, para poder explicarlo bien, procederé a profundizar sobre cada uno de estos conceptos.
Una Red Neuronal:
Podemos definir una red neuronal como un sistema de aprendizaje automático (Machine Learning) inspirado en el funcionamiento del cerebro humano. Es decir, se trata de un tipo de software que puede aprender y mejorar su rendimiento en la ejecución de una tarea específica de forma autónoma sin ser programado explícitamente para ello.
Para lograr algo así, estos sistemas son entrenados con grandes cantidades de datos, lo que les permite la identificación de patrones y la toma de decisiones sin necesidad de intervención humana.
Una Red Neuronal Profunda:
Las neuronas artificiales son “unidades de procesamiento simple” cuyo funcionamiento está inspirado en las neuronas biológicas del cerebro humano, que son, como todos sabemos, células especializadas en la transmisión de información.
En esta línea, al hablar de las redes neuronales, el término “capa” hace referencia al conjunto de neuronas artificiales que trabajan juntas para procesar la información. De esta forma, se trata de capas que se apilan unas encima de otras para formar la estructura completa de la red neuronal en cuestión.
Dicho esto, llega el momento de aclarar que la principal diferencia entre una red neuronal profunda y una red neuronal no profunda radica en el número de capas que poseen. Así, mientras que una red neuronal no profunda tan solo tiene una o dos capas de neuronas artificiales, las redes neuronales profundas poseen múltiples capas y logran un mayor nivel de complejidad y aprendizaje.
Y, como resultado, las redes con más capas tienen mayor capacidad de aprendizaje, son más fáciles de entrenar, cuentan con mayor flexibilidad y ejecutan mucho mejor tareas complejas.
Procesamiento de Lenguaje Natural (PLN)
El procesamiento del lenguaje natural (o de lenguas naturales) es un campo de conocimiento de la inteligencia artificial que se ocupa de investigar la comunicación entre máquinas y personas a través del uso de lenguas naturales (sistemas de comunicación generados de forma espontánea por los humanos), como son el español, el inglés o el chino.
En esta línea, parte con el claro objetivo de que las máquinas sean capaces de entender, interpretar y generar lenguaje natural de forma similar a como lo hacen los humanos, lo que facilita enormemente la interacción entre ambos.
El Papel de Google
No obstante, en la denominación de ChatGPT para muchos destaca la “T”, que significa Transformer, una tecnología desarrollada por Google sobre la que además consiguió distintas patentes. Es decir, ChatGPT se desarrolló en gran medida gracias a las investigaciones y logros de este gigante de la tecnología.
Y hoy quizás podría optar por ir a los tribunales, pero, como se indica en su propia página web, la filosofía de Google es la de poner su investigación a disposición de cualquiera como código abierto, teniendo el foco puesto hoy en cómo integrar con éxito toda esta tecnología en sus negocios actuales.
Link a la filosofía de Google: https://research.google/philosophy/
Por ello los investigadores externos pueden acceder a una parte muy importante de la tecnología IA del gigante, para así seguir desarrollando sobre ella. Y es la razón por la que ChatGPT debe, sin duda, gran parte de su éxito precisamente a Google, su gran competidor, cuyos avances en este ámbito podíamos disfrutar en su experimento Verse by Verse.
Verse by Verse es un proyecto de Google AI que ha desarrollado una plataforma que, utilizando la inteligencia artificial, es capaz de crear poesía, usando como referencia y fuente de inspiración el estilo de poetas clásicos de habla inglesa.
Link de acceso: https://sites.research.google/versebyverse/
Disponible desde el año 2020, se trata de una herramienta gratuita, accesible en línea, y no genera los poemas de cualquier manera, puesto que permite a los usuarios seleccionar hasta tres autores de poesía clásica estadounidense para inspirarse y, tras elegir el formato del poema y la primera línea del mismo, se encargará de producir el resto con el estilo del autor o de los autores seleccionados.
Su sistema de funcionamiento está basado en un Transformador Preentrenado Generativo (GPT por sus siglas en inglés). Es decir, se trata de una tecnología que funciona a través de dos fases:
En primer lugar el “entrenamiento” no supervisado, una etapa en la que se entrena a estas tecnologías con millones de textos, como libros, artículos y, por supuesto, conversaciones, con el objetivo de que sean capaces de entender cómo funciona el lenguaje y así poder usarlo con estos fines con unos niveles de calidad y precisión que hasta el momento tan solo hemos visto en las obras de ciencia ficción.
Tras esto llega la fase del “afinamiento”, momento en el que el funcionamiento de las tecnologías es supervisado por agentes humanos, responsables de asegurar que su desempeño sea el adecuado. Esto permite que el modelo pueda ajustar sus parámetros para mejorar su rendimiento en las tareas deseadas.
En concreto, esta arquitectura basa su funcionamiento en un mecanismo que permite al modelo enfocarse en las partes más relevantes del contexto al generar una predicción sobre cuál será (o debería ser) la siguiente palabra del texto sobre el que está trabajando. En definitiva, estamos hablando de modelos de lenguaje probabilísticos que se entrenan para predecir la siguiente palabra en una secuencia.
Conclusiones:
Si bien es indudable que ChatGPT ha experimentado un éxito sin precedentes, y que ha sido el responsable de abrir los ojos del mundo al potencial de la IA conversacional, hay que recordar que no es ni será el único chatbot conversacional que ha alcanzado el éxito.
De hecho, la competencia en el ámbito de los chatbots conversacionales es feroz, y lo cierto es que cada proyecto ofrece sus propias ventajas y características únicas, por lo que es fácil imaginar un futuro en el que la coexistencia de diversos chatbots especializados en diferentes áreas será lo más probable. Y allí resultará importante entender y controlar muy bien las diferencias entre todos ellos para que seamos capaces de sacar el máximo potencial que nos den en cada momento. ¿Preparado para este nuevo reto?
COLABORACIÓN DE:
Silvia Leal es Doctora en Sociología, asesora de la OCDE y de la Comisión Europea y ha sido reconocida durante tres años consecutivos como una de las diez expertas más influyentes de España. Cuenta con una larga trayectoria en el mundo empresarial y académico, habiendo colaborado con escuelas de negocios como el IE Business School, donde desempeñó el cargo de Directora de Programas de Innovación y Tecnología.
Es Experta Internacional en Tendencias y Tecnología. Speaker, Consejera y Escritora. Inversora en startups tecnologicas . Senior Advisor en Evercom y la Community of Insurance.
Miembro del Comité de Expertos de la Asociación Española de Retail y experta líder del área de empleo en Human Age Institute (ManpowerGroup). Durante tres años consecutivos ha sido reconocida como una de las 10 expertas más influyentes de España.
Enlaces:
https://silvialeal.es/
PRONTO. ¡ESPÉRALO!
¿Aún no has descargado nuestra guía básica para tu inicio en la adopción de la IA en el campo laboral? ¡Hazlo ahora, no tiene costo!