Aprendizaje automático (AA): todo lo que hay que saber

Durante mucho tiempo se ha considerado que el aprendizaje es una capacidad claramente humana, algo moldeado por la experiencia, el juicio y la intuición. Hoy en día, esa suposición está en tela de juicio. Los avances en inteligencia artificial (IA) están permitiendo a los sistemas aprender de los datos, adaptarse a nueva información y realizar tareas que antes se consideraban dominio exclusivo de la inteligencia humana.

En el centro de este cambio se encuentra el aprendizaje automático (AA). En lugar de seguir instrucciones fijas, los sistemas de AA mejoran con el tiempo, identificando patrones y tomando decisiones con creciente autonomía. No se trata sólo de un avance técnico, sino que está transformando el funcionamiento de las organizaciones, la toma de decisiones y el planteamiento de problemas complejos.

Pero a medida que el aprendizaje automático se integra más en los sistemas del mundo real, las cuestiones se vuelven más prácticas. ¿Cómo funciona realmente? ¿Qué hace que sea fiable? ¿Y cómo puede utilizarse para obtener resultados coherentes y fiables?

En este artículo exploramos el fascinante mundo del aprendizaje automático en inteligencia artificial: cómo funciona, cómo se aplica en la práctica y cómo las normas respaldan su uso seguro y fiable.

¿Qué es el AA?

Elegir claramente una definición de aprendizaje automático puede ser todo un desafío. El aprendizaje automático, o AA, es un tipo de inteligencia artificial que permite a las máquinas aprender de los datos sin ser programadas explícitamente. Para ello, optimiza los parámetros del modelo (es decir, variables internas) mediante cálculos, de manera que el comportamiento del modelo refleje los datos o la experiencia. A continuación, el algoritmo de aprendizaje actualiza continuamente los valores de los parámetros a medida que avanza el aprendizaje, lo que permite al modelo de AA aprender y realizar predicciones o tomar decisiones basadas en la ciencia de datos.

Las aplicaciones del aprendizaje automático son muy amplias y abarcan sectores como la salud, las finanzas, el marketing, el transporte, etc. En la práctica, los modelos de aprendizaje automático ya se utilizan para el reconocimiento de imágenes, el procesamiento del lenguaje natural, la detección de fraudes, los sistemas de recomendación, los vehículos autónomos y la medicina personalizada.

Globalmente, el aprendizaje automático desempeña un papel crucial ya que permite a las computadoras aprender de las experiencias y los datos para mejorar su desempeño en tareas específicas sin necesidad de programarlas. Alberga el potencial de revolucionar diversas industrias al automatizar procesos complejos y realizar predicciones o tomar decisiones inteligentes al «digerir» grandes cantidades de información.

¿Cómo se compara el aprendizaje automático con el aprendizaje profundo y las redes neuronales?

El aprendizaje profundo es un subconjunto del aprendizaje automático que se enfoca en el entrenamiento de redes neuronales artificiales. Con sus múltiples capas, las redes neuronales se inspiran en la estructura y el funcionamiento del cerebro humano. Al igual que nuestro cerebro, están formadas por nodos interconectados (neuronas) que transmiten señales.

Estos algoritmos complejos dominan el reconocimiento de imágenes y del habla, en el procesamiento del lenguaje natural y en otros muchos campos al extraer automáticamente características de los datos en bruto a través de múltiples capas de abstracción. El aprendizaje profundo es capaz de manejar conjuntos de datos de una escala masiva y con entradas pluridimensionales. Para ello, necesita una potencia de cálculo considerable y un amplio entrenamiento.

Suscríbase para recibir actualizaciones por correo electrónico

¡Manténgase al día sobre la inteligencia artificial y las normas relacionadas!

* Boletín de noticias en inglés
Cómo se utilizarán sus datos

Consulte nuestro aviso de privacidad. Este sitio está protegido por reCAPTCHA. Se aplican la Política de privacidad y las Condiciones del servicio de Google

Cómo funciona el aprendizaje automático

El primer paso del aprendizaje automático es recoger datos relevantes que pueden proceder de fuentes tales como bases de datos, sensores o Internet.

  • Preprocesamiento de datos: una vez recogidos los datos, es necesario preprocesarlos para garantizar su calidad e idoneidad para el análisis.
  • Entrenamiento del modelo: El siguiente paso es entrenar un modelo de aprendizaje automático: un algoritmo o representación matemática que aprende a hacer predicciones o tomar decisiones a partir de datos de entrada.
  • Selección e ingeniería de características: A continuación, ese modelo de aprendizaje automático selecciona las características más relevantes de los datos de entrada que tendrán un impacto significativo en el rendimiento del modelo.
  • Evaluación y optimización del modelo: una vez entrenado un modelo, es necesario evaluarlo para valorar su desempeño y determinar si satisface los criterios deseados.
  • Implementación y supervisión: tras un entrenamiento y una evaluación satisfactorios, el modelo puede implementarse en aplicaciones de aprendizaje automático del mundo real.

Modelos de aprendizaje automático

El aprendizaje automático desarrolla la informática existente apoyándose en gran medida en la estadística, la teoría de la probabilidad y las técnicas de optimización. Existen tres tipos principales de modelos de aprendizaje automático:

Aprendizaje supervisado

El aprendizaje automático supervisado se basa en conjuntos de datos de entrenamiento etiquetados y se utiliza para predecir resultados o clasificar datos. Según se proporcionan los datos al modelo de AA, pasan por un proceso de validación cruzada que ajusta su ponderación hasta que se adaptan adecuadamente. Este modelo admite funciones como reconocimiento facial, detección de objetos o control de calidad.

Aprendizaje no supervisado

Al contrario que el aprendizaje supervisado, el aprendizaje no supervisado se basa en conjuntos de datos no etiquetados. El objetivo del aprendizaje no supervisado es enseñar a los modelos de AA a detectar patrones o estructuras ocultas sin supervisión humana. Por esto, las empresas pueden utilizar aprendizaje no supervisado para respaldar la segmentación de clientes, estrategias de venta cruzada o análisis de datos.

Aprendizaje por refuerzo

El aprendizaje por refuerzo es parecido al aprendizaje supervisado, pero utiliza el método de ensayo y error. Sin conjuntos de datos de entrenamiento etiquetados, el aprendizaje por refuerzo entrena a los modelos de AA para que desarrollen las mejores recomendaciones basándose en una serie de resultados satisfactorios.

Diferencias entre un modelo de aprendizaje automático y un algoritmo de aprendizaje automático

En resumen, un modelo de aprendizaje automático es un producto final. Es la representación de lo que ocurre cuando se aplica un algoritmo de aprendizaje automático a un conjunto de datos. Su objetivo es generalizar más allá de los datos de entrenamiento en lugar de simplemente memorizar los ejemplos con los que se le ha entrenado. En otras palabras, el modelo es una herramienta que se puede utilizar para cosas como predecir resultados e identificar patrones.

En cambio, el algoritmo de aprendizaje automático es la técnica utilizada para entrenar un modelo de aprendizaje automático. Existen varios algoritmos -regresión lineal, máquinas de vectores soporte, redes neuronales profundas- y cada uno tiene sus propias formulaciones y complejidades. Sin embargo, todos ellos tienen como propósito reducir el margen de error entre las predicciones de los modelos y el resultado deseado de los conjuntos de datos de entrenamiento.

En un sistema de clasificación de imágenes, por ejemplo, el modelo de aprendizaje automático es la función matemática que identifica si una imagen contiene un gato o un perro, habiendo aprendido patrones a través de los datos de entrenamiento. El algoritmo de aprendizaje automático es el método que se utiliza para entrenar dicho modelo, optimizando sus parámetros para mejorar su precisión al clasificar. Una vez entrenado, el modelo podrá usarse para clasificar nuevas imágenes no vistas antes en función de si contienen un gato o un perro.

¿Cómo se evalúan los modelos de AA?

Entrenar un modelo AA es sólo el primer paso. La verdadera cuestión es si puede funcionar de forma fiable cuando se enfrenta a datos nuevos y desconocidos. Para comprobarlo, los datos suelen dividirse en dos partes: un conjunto de entrenamiento (utilizado para enseñar al modelo) y un conjunto de prueba (utilizado para evaluar su rendimiento con datos que no ha visto antes). Esto ayuda a determinar si el modelo ha aprendido patrones significativos o simplemente está reproduciendo lo que ya se le ha mostrado.

El rendimiento se mide utilizando una serie de parámetros, en función de la tarea. Para la clasificación, puede incluir exactitud, precisión, recuperación y puntuación F1; para la regresión, se utilizan medidas como el error cuadrático medio. Técnicas como la validación cruzada, en la que los datos se dividen repetidamente y se prueban de diferentes maneras, proporcionan una imagen más sólida de cómo es probable que se comporte el modelo de AA en la práctica.

Pero la evaluación no es sólo cuestión de números. Para comprender realmente el rendimiento de un modelo, es importante ver cómo aprende y si ese aprendizaje se mantendrá más allá de los datos de entrenamiento. Esto nos lleva a dos conceptos fundamentales en el aprendizaje automático: el sobreajuste y la generalización.

¿Qué es el sobreajuste?
El sobreajuste se produce cuando un modelo de AA aprende demasiado bien los datos de entrenamiento, incluyendo su ruido e irregularidades, en lugar de los patrones subyacentes. En efecto, el modelo "memoriza" el conjunto de entrenamiento en lugar de aprender a generalizar a partir de él. Esto puede dar lugar a resultados impresionantes durante el entrenamiento, pero a un rendimiento deficiente cuando el modelo se aplica a datos nuevos. En la práctica, el sobreajuste es una señal clara de que el modelo probablemente no sea fiable en condiciones reales.

¿Por qué importa la generalización?
La generalización es la capacidad de un modelo de aprendizaje automático para aplicar lo que ha aprendido a datos nuevos y desconocidos. Es lo que permite que un modelo pase de la teoría al uso práctico. Un modelo de AA bien generalizado ofrece predicciones coherentes y precisas fuera de su entorno de entrenamiento. Alcanzar este equilibrio -aprender lo suficiente para captar patrones significativos, pero no tanto como para que el modelo se vuelva excesivamente específico- es la clave de un aprendizaje automático eficaz.

En última instancia, la evaluación es algo más que medir los resultados. Se trata de garantizar que se puede confiar en que los modelos funcionen en el mundo real.

Aplicaciones prácticas del aprendizaje automático

Esta capacidad de obtener resultados fiables más allá de los datos de entrenamiento es lo que permite al aprendizaje automático pasar de la teoría al impacto en el mundo real. Hoy en día, está integrada en muchas de las tecnologías y servicios que utilizamos a diario, a menudo sin darnos cuenta.

Al aprender de los datos, identificar patrones y facilitar la toma de decisiones, el aprendizaje automático está cambiando el funcionamiento de las organizaciones y la prestación de servicios. Sus aplicaciones son muy variadas y se extienden rápidamente por todos los sectores.

Algunas de las aplicaciones más comunes del aprendizaje automático son:

  • Sanidad: El aprendizaje automático apoya el análisis de imágenes médicas, como radiografías y resonancias magnéticas, ayudando a detectar antes las enfermedades y a mejorar la precisión del diagnóstico.
  • Finanzas: Los bancos y las instituciones financieras utilizan el aprendizaje automático para detectar transacciones fraudulentas, evaluar el riesgo crediticio y automatizar la toma de decisiones.
  • Venta al por menor y comercio electrónico: Las plataformas en línea se basan en algoritmos de aprendizaje automático para recomendar productos, personalizar las experiencias de los usuarios y optimizar el inventario en función de los patrones de demanda.
  • Transportes: El aprendizaje automático ayuda a predecir la demanda, optimizar las rutas y permitir la fijación dinámica de precios en los servicios de movilidad y logística.
  • Fabricación: El mantenimiento predictivo basado en el aprendizaje automático anticipa los fallos de los equipos, reduciendo el tiempo de inactividad y los costes operativos.
  • Entretenimiento: Servicios de streaming como Netflix y Spotify utilizan modelos de aprendizaje automático para adaptar las recomendaciones de contenidos a las preferencias individuales.
  • Servicio al cliente: Los asistentes virtuales y los chatbots se basan en el aprendizaje automático para ofrecer respuestas rápidas y personalizadas y mejorar la experiencia del usuario.

¿Cuáles son las ventajas del aprendizaje automático?

Estos ejemplos ilustran un cambio más amplio: el aprendizaje automático ya no es una tecnología emergente, sino una realidad operativa que está configurando el funcionamiento de los sistemas y la toma de decisiones a gran escala. Ofrece una amplia gama de ventajas en todos los sectores, ayudando a las organizaciones a pasar de los datos a la información, y de la información a la acción.

Las ventajas del aprendizaje automático pueden agruparse en tres áreas clave:

Mejorar la eficacia y la automatización

Una de las ventajas más inmediatas del aprendizaje automático es su capacidad para automatizar tareas repetitivas y laboriosas. Los algoritmos de aprendizaje automático pueden procesar datos a escala, identificar ineficiencias y optimizar los flujos de trabajo con una intervención humana mínima.

Esto favorece una asignación de recursos más eficiente, reduce los costes operativos y permite a los equipos centrarse en actividades de mayor valor. En ámbitos como la fabricación, la logística o los recursos humanos, el aprendizaje automático ayuda a agilizar los procesos, desde el mantenimiento predictivo hasta la contratación y la planificación.

Mejorar el conocimiento y la toma de decisiones

El aprendizaje automático es excelente para analizar conjuntos de datos complejos y descubrir patrones difíciles de detectar con métodos tradicionales. Al convertir los datos en información práctica, el aprendizaje automático permite tomar decisiones más informadas y orientadas al futuro.

La capacidad de predicción es un elemento clave. Los algoritmos de aprendizaje automático pueden anticipar tendencias, comportamientos y riesgos basándose en datos históricos, lo que permite a las organizaciones actuar de forma proactiva, ya sea en la previsión financiera, la planificación de la demanda o la gestión de riesgos.

Transformar la experiencia del usuario y los servicios

El aprendizaje automático también desempeña un papel fundamental a la hora de determinar cómo interactúan los usuarios con los productos y servicios. Al analizar las preferencias y el comportamiento, permite experiencias altamente personalizadas, desde recomendaciones de productos hasta contenidos a medida e interacciones en tiempo real.

Al mismo tiempo, mejora la prestación de servicios mediante aplicaciones como chatbots, sistemas de detección de fraudes y diagnósticos médicos. En cada caso, el aprendizaje automático ayuda a que los servicios sean más rápidos, precisos y sensibles a las necesidades individuales.

El aprendizaje automático a examen: riesgos, repercusiones y controles

A medida que las ventajas del aprendizaje automático se hacen más evidentes, también lo hacen las responsabilidades que conlleva su uso. El creciente papel de los modelos de AA en la toma de decisiones significa que su impacto se extiende ahora más allá del rendimiento técnico a consideraciones sociales y organizativas más amplias. Aunque el aprendizaje automático tiene el poder de impulsar la eficiencia y la innovación, también puede introducir riesgos si no se desarrolla e implanta con cuidado. Abordar estos retos es esencial para garantizar que estos sistemas sigan siendo fiables, justos y de confianza.

En la práctica, los riesgos tienden a surgir a dos niveles: en cómo el aprendizaje automático afecta a los individuos y en su impacto más amplio en los sistemas y la sociedad.

Impacto en las personas

A nivel individual, algunas de las preocupaciones más acuciantes están relacionadas con la forma en que los sistemas de AA toman decisiones y cómo esas decisiones afectan a las personas.

  • Prejuicios e imparcialidad: Los modelos de AA pueden aprender y reforzar involuntariamente los sesgos presentes en sus datos de entrenamiento. Esto puede dar lugar a resultados injustos, como que los sistemas de reconocimiento facial funcionen mal con determinados grupos demográficos o que los algoritmos de contratación favorezcan a candidatos de orígenes específicos. La eliminación de los sesgos requiere una cuidadosa selección de los datos, auditorías periódicas y un seguimiento continuo.
  • Transparencia y explicabilidad: Muchos modelos avanzados de AA, en particular las redes neuronales profundas, funcionan como "cajas negras", lo que hace que sus procesos de toma de decisiones sean difíciles de entender o cuestionar. Esto puede minar la confianza, sobre todo en ámbitos de alto riesgo como la sanidad o la justicia penal.
  • Privacidad: Los sistemas de aprendizaje automático a menudo se basan en grandes conjuntos de datos que pueden contener información personal sensible. Sin las salvaguardias adecuadas, existe el riesgo de uso indebido o exposición involuntaria.

Impacto en los sistemas y la sociedad

Más allá del nivel individual, el aprendizaje automático también plantea riesgos sistémicos más amplios.

  • Seguridad y ataques de adversarios: Los modelos de AA pueden ser vulnerables a la manipulación selectiva, en la que pequeños cambios en los datos de entrada conducen a predicciones incorrectas. Esto es especialmente crítico en aplicaciones sensibles a la seguridad (por ejemplo, vehículos autónomos o servicios financieros).
  • Impacto social y económico: El creciente uso del aprendizaje automático puede remodelar los mercados laborales. Aunque crea nuevas oportunidades, también puede provocar el desplazamiento de puestos de trabajo en determinados sectores y, si no se gestiona con cuidado, contribuir a aumentar las desigualdades.

Reconociendo estos retos, las organizaciones están poniendo mayor énfasis en cómo se gobiernan y controlan los sistemas de aprendizaje automático. Esto incluye mejorar la transparencia, mitigar la parcialidad y reforzar la protección de datos como parte de un enfoque más estructurado. Las normas internacionales apoyan este esfuerzo proporcionando un marco para crear y gestionar sistemas de aprendizaje automático de forma coherente, fiable y apta para su uso en el mundo real.

El papel de las normas en el aprendizaje automático

A medida que los sistemas de aprendizaje automático pasan de la experimentación al uso en el mundo real, el reto ya no es sólo crear modelos, sino garantizar que funcionen de forma fiable a lo largo del tiempo. Los datos evolucionan, los modelos se desvían y el rendimiento puede degradarse, lo que significa que incluso los pequeños errores pueden tener consecuencias importantes. Sin una estructura clara, es difícil mantener la confianza.

Las Normas Internacionales proporcionan esa estructura. Definen un enfoque común sobre cómo diseñar, implantar y supervisar los sistemas de aprendizaje automático, lo que ayuda a garantizar que el rendimiento no sólo se consiga, sino que se mantenga a lo largo del tiempo. Al aportar claridad a la gobernanza de los datos, el desarrollo de modelos y la supervisión de sistemas, contribuyen a reforzar la fiabilidad y permiten aplicar el aprendizaje automático a escala con mayor confianza.

ISO, en colaboración con la Comisión Electrotécnica Internacional (IEC), ha publicado una serie de normas relacionadas con el aprendizaje automático a través de su grupo especializado de expertos en inteligencia artificial (ISO/IEC JTC 1/SC 42). Su norma más reciente en la materia es la ISO/IEC 23053, que proporciona un marco para los sistemas de IA que utilizan el aprendizaje automático.

Historia del aprendizaje automático

Para responder plenamente a la pregunta "¿qué es el aprendizaje automático?", debemos volver sobre nuestros pasos. Los orígenes del AA se remontan a la década de 1950. Desde sus primeras iteraciones hasta la tecnología en rápida evolución que conocemos hoy, el AA ha sido moldeado -y sigue siéndolo- por décadas de avances y contratiempos.

Origen humilde (1950-1960)

En 1950, Arthur Samuel dio el primer paso en el camino de la inteligencia artificial y el aprendizaje automático. Su trabajo demostró la capacidad de aprender de las computadoras cuando enseñó a un programa a jugar a las damas. Sin embargo, no era un programa diseñado explícitamente para ejecutar instrucciones específicas. Este programa podría aprender de los errores del pasado y actuar para mejorar su desempeño. Más tarde, Samuel creó el término «aprendizaje automático» y lo definió como «el campo de estudio que da a las computadoras la capacidad de aprender sin ser explícitamente programadas».

Tan solo ocho años más tarde, en 1958, Frank Rosenblatt introdujo el Perceptrón, un modelo simplificado de una neurona artificial. Este algoritmo podía aprender a reconocer patrones en datos y fue la primera iteración de una red neuronal artificial. Evgenii Lionudov y Aleksey Lyapunov complementaron estas innovaciones en la década de 1960 a través de su trabajo sobre algoritmos de retropropagación y la teoría de aprendizaje automático. En la década de 1980, existía un algoritmo capaz de entrenar redes neuronales multicapa con eficiencia.

Los años perdidos (1960-1970)

Perceptrons, de Marvin Minsky y Seymour Papert, publicado en 1969, puso de manifiesto las limitaciones de las redes neuronales. Combinado con la potencia de cálculo limitada, una falta de datos disponibles y otros factores, este influyente libro contribuyó sin querer al primer «invierno de la IA», caracterizado por una financiación mínima y un escaso interés en la investigación.

El renacimiento (1980-1990)

John Hopfield pondría fin a este "invierno de la IA" con la introducción de su red neuronal recurrente -la red de Hopfield- en 1982. Así, David Rumelhart, Geoffrey Hinton, Ronald Williams y otros se animaron a revivir los estudios de retropropagación y redes neuronales multicapa. En 1989 se dio el primer gran avance en el campo de la visión artificial gracias al trabajo de Yann LeCun sobre redes neuronales convolucionales (CNN, por sus siglas en inglés).

La introducción de las máquinas de vectores soporte (SVM) por Vladimir Vapnik en 1995 y el desarrollo de las redes de memoria a corto plazo (LSTM) por Sepp Hochreiter y Jürgen Schmidhuber en 1997 impulsaron aún más este floreciente campo.

Los grandes avances (2010)

El aprendizaje automático logró una victoria decisiva sobre las computadoras tradicionales en 2012 cuando AlexNet, una red neuronal convolucional, superó a los métodos tradicionales de visión artificial en la competición ImageNet de 2012.

A partir de entonces, se sucedieron una serie de avances históricos. En 2014, las redes generativas adversativas (GAN, por sus siglas en inglés) de Ian Goodfellow permitirían a los investigadores generar datos sintéticos realistas. En 2016, el sistema AlphaGo de DeepMind venció al campeón mundial del juego de mesa japonés Go. Y en 2017, los modelos transformadores revolucionaron la capacidad de procesamiento de lenguaje natural.

Acontecimientos recientes (2010-presente)

Desde entonces, el campo ha seguido desarrollando arquitecturas de aprendizaje profundo y ampliando las aplicaciones del aprendizaje automático a sectores como la sanidad, las finanzas e incluso el entretenimiento. El aprendizaje automático ha comenzado a integrarse en dispositivos de Internet de las Cosas (IdC) y otros campos como la computación cuántica, la neurociencia y la física.

Entre todo este rápido progreso, también viene un énfasis creciente en reflexiones acerca de un uso responsable de los sistemas de aprendizaje automático. Además, los avances en cuanto a técnicas de aprendizaje no supervisado y autoaprendizaje han dado más importancia a la gestión de datos y cómo los modelos de AA se aplican en la vida real.

Puntos clave del aprendizaje automático

El aprendizaje automático está reconfigurando el funcionamiento de las organizaciones, la toma de decisiones y la creación de valor. Desde la sanidad y las finanzas hasta el transporte y los servicios digitales, permite a los sistemas aprender de los datos, generar ideas y automatizar tareas cada vez más complejas.

A medida que crece su adopción, resulta esencial comprender cómo funciona el aprendizaje automático en la práctica, desde el desarrollo y la evaluación de modelos hasta su implantación en el mundo real. Igual de importante es reconocer los riesgos asociados a su uso, sobre todo en materia de equidad, transparencia y privacidad.

Aquí es donde la confianza se convierte en el verdadero factor diferenciador.

Las normas internacionales sientan las bases para generar esa confianza, aportando coherencia, responsabilidad y claridad a la forma en que se desarrollan e implantan los modelos de AA. Porque el futuro del aprendizaje automático no se definirá por lo que pueda hacer, sino por la confianza con que pueda utilizarse. Y con los marcos adecuados, esa confianza puede aumentar.

Contacto de prensa

Equipo responsable de los contenidos
ISO, Ginebra, Suiza
+41 22 749 01 11
team-content@iso.org