Machine learning: definición, métodos y ejemplos

ITSM: The Definitive Guide
Join IT Pulse, our weekly newsletter

Receive the latest news of the IT word. right in your inbox

El machine learning o aprendizaje automático acaparó la atención de todos en los últimos años. Esto se debe a la gran cantidad de datos que manejan las aplicaciones, el creciente poder computacional, el desarrollo de mejores algoritmos y una comprensión más profunda de la ciencia de los datos.

Ya hablamos de la inteligencia artificial (IA) en otra nota. En esta oportunidad, aprenderemos sobre el machine learning: qué es y cómo funciona, además de dar ejemplos y las posibilidades de aplicaciones en ITSM.

Es hora de profundizar en la cuestión.

¿Qué es machine learning?

En pocas palabras, machine learning es un subcampo de la IA junto con la ciencia de los datos. Su objetivo es comprender la estructura de los datos y ajustarlos a modelos que puedan ser entendidos y utilizados por ingenieros y agentes del aprendizaje automático en diferentes áreas de trabajo.

En cuanto a su historia, hay que decir que en 1959, Arthur Samuel -quien fue un pionero estadounidense de los juegos en la computadora y la inteligencia artificial- acuñó el término "machine learning". Él aseguraba que otorgaba a las PCs la capacidad de aprender, sin ser programadas explícitamente.

Y en 1997, Tom Mitchell plasmó una definición matemática y relacional "bien planteada" sobre el tema: "Se dice que un programa informático aprende de la experiencia (E) en relación con alguna tarea (T) y alguna medida de rendimiento o performance (P), si su rendimiento en (T), medido por (P), mejora con la experiencia (E)", explicó. 

Esto prepara el terreno para nuestra siguiente gran pregunta.

¿Cómo funciona el machine learning?

Aunque el machine learning es un área dentro de la ciencia de la computación y la IA, difiere de los enfoques informáticos tradicionales. En éstos, los algoritmos constituyen conjuntos de instrucciones explícitamente programadas que utilizan las PCs para calcular o resolver problemas. 

Mientras que en el machine learning, los algoritmos de aprendizaje permiten a las computadoras entrenarse con datos de entrada y utilizar el análisis estadístico para obtener valores de salida que se ubican dentro de un rango específico. 

Como resultado, el aprendizaje automático facilita a las PCs la construcción de modelos a partir de datos de muestra con la finalidad de automatizar los procesos de toma de decisiones. Una versión más compleja se denomina red neuronal.

¿Cuáles son los distintos métodos del machine learning?

El machine learning tiene tareas en categorías generales, las cuales provienen del aprendizaje recibido o de la retroalimentación dada al sistema.

Los dos métodos de machine learning más adoptados son: 

  • Aprendizaje supervisado: entrena algoritmos basados en datos de entrada y salida de ejemplo que etiquetan los humanos.
  • Aprendizaje no supervisado: proporciona al algoritmo del machine learning datos no etiquetados que le permiten encontrar la estructura dentro de sus datos de entrada. 

Veamos estos métodos con más detalle.

Aprendizaje supervisado

En el aprendizaje supervisado, un algoritmo del machine learning aprende a partir de datos de ejemplo y respuestas objetivo asociadas que consisten en valores numéricos o string labels (clases o etiquetas). A continuación, predice la respuesta correcta.

Este enfoque es similar al aprendizaje humano bajo la supervisión de un profesor, en el que éste proporciona buenos ejemplos para que el alumno los memorice, quien luego puede deducir las reglas generales a partir de estos ejemplos específicos. 

Un algoritmo del machine learning conocido, basado en el aprendizaje supervisado, se denomina regresión lineal.

Aprendizaje no supervisado

En el aprendizaje no supervisado, los datos no están etiquetados, por lo que el algoritmo tiene que encontrar puntos en común entre sus datos de entrada. Como los datos no etiquetados son más abundantes que los etiquetados, los métodos del machine learning son especialmente valiosos.

El objetivo del aprendizaje no supervisado puede ser tan sencillo como descubrir patrones ocultos en un conjunto de datos. 

Es posible que también tenga el propósito del aprendizaje de características, que permite a la computadora encontrar las representaciones necesarias para clasificar automáticamente los datos sin procesar.

Los siete pasos del machine learning

1. Recopilación de los datos

Nuestro primer paso es recopilar datos relevantes para su diferenciación. Por ejemplo: dos galletas. Utilizamos distintos parámetros para clasificarlas: de chocolate o de mantequilla. 

Para simplificar, sólo tomaremos dos características que nuestro modelo usará para realizar su operación. La primera será las manchas en la galleta; y la segunda, el tamaño. 

Esperamos que nuestro modelo pueda diferenciarlas con precisión utilizando estas características.

2. Preparación de los datos

Nuestro siguiente paso es preparar los datos para las acciones posteriores. 

Un punto clave es reconocer y minimizar cualquier margen de error en el conjunto de datos para las dos características. Siguiendo el ejemplo, vamos a hacer que el orden de los datos sea aleatorio. Porque no queremos que afecte a las elecciones del modelo.

Unos datos bien preparados para tu modelo mejorarán su eficacia. Además, ayudará a reducir los puntos ciegos, lo que se traduce en una mayor precisión de las predicciones.

3. Elección de un modelo

La selección del tipo de modelo es nuestro siguiente paso. Los científicos de datos tienen diferentes propósitos para los distintos modelos existentes. 

Estos modelos cuentan con diversos objetivos. Por ejemplo, algunos son más adecuados para tratar textos, mientras que otros estarán mejor preparados para las imágenes.

4. Entrenamiento

En el núcleo de la máquina, el proceso de aprendizaje es el entrenamiento del modelo. La mayor parte del "aprendizaje" se realiza en esta fase. 

Aquí utilizamos la parte del conjunto de datos asignada al entrenamiento para enseñar a nuestro modelo a diferenciar entre las dos galletas.

5. Evaluación

Con el modelo entrenado, se comprueba si funcionará en situaciones del mundo real. Por eso, la parte del conjunto de datos creada para la evaluación testea la competencia del modelo. De hecho, lo deja en un escenario con problemas a sortear, que no formaban parte de su entrenamiento.

6. Ajuste de los parámetros

Una vez realizada la evaluación, podemos mejorar aún más nuestro entrenamiento, ajustando los parámetros. Porque algunos los asumimos implícitamente cuando hicimos el entrenamiento. Así que ahora es el momento para volver atrás y probar esas suposiciones así como otros valores.

7. Predicción

La última etapa del proceso del machine learning es la predicción, donde consideramos que el modelo está listo para las aplicaciones prácticas. Siguiendo el ejemplo, ahora debería ser capaz de responder si la galleta dada es con pepitas de chocolate o de mantequilla. 

¿Qué es el aprendizaje profundo?

El aprendizaje profundo es una técnica del machine learning que enseña a las PCs a hacer algo que es natural para los humanos: aprender con el ejemplo. 

Se trata de una tecnología crucial, por ejemplo, en los vehículos sin conductor, que les permite reconocer una señal para detenerse o distinguir a un peatón de un poste de luz. 

La clave del control por voz se encuentra en dispositivos como teléfonos, tabletas, televisores y altavoces manos libres. El aprendizaje profundo está recibiendo mucha atención últimamente, y por una buena razón: es que consigue resultados que antes no eran posibles.

¿Cómo se utiliza hoy en día el machine learning?

El machine learning puede automatizar tareas mundanas y ofrecer insights inteligentes. Es posible que ya utilices un rastreador de fitness wearable como Fitbit o un asistente doméstico inteligente como Google Home. Industrias de todos los sectores intentan beneficiarse de él. 

En tanto las redes neuronales suelen encargarse de otras tareas más complejas, como:

  • Predicción: el machine learning predice sistemas. Por ejemplo, si pides un préstamo, el sistema tendrá que clasificar los datos disponibles para calcular la probabilidad de incumplimiento.
  • Reconocimiento de imágenes: también se utiliza en el reconocimiento facial de imágenes y vídeos. Hay una categoría distinta para cada persona en una base de datos de varios individuos.
  • Reconocimiento de texto: La tecnología OCR se basa en algoritmos de aprendizaje automático, como la herramienta que convierte la imagen en texto para hacer que el contenido sea editable, actualizable y almacenable.
  • Reconocimiento de voz: se utiliza el aprendizaje automático para traducir palabras habladas en texto, como el software que convierte audios en escritos, búsquedas por voz, etc. Las interfaces de usuario incluyen marcado por voz, enrutamiento de llamadas y control de aparatos. También puede tratarse de una simple introducción de datos y la elaboración de documentos estructurados: el Procesamiento del Lenguaje Natural o Natural Language Processing (PLN) en el aprendizaje automático se encarga del reconocimiento de voz.
  • Diagnósticos médicos: el machine learning tiene varios usos medicinales; por ejemplo, reconoce tejidos cancerígenos.
  • Industria financiera y comercio: las empresas utilizan el aprendizaje automático en investigaciones de fraude y comprobaciones de crédito.

¿Cómo utilizar el machine learning en ITSM?

Al igual que la IA, las aplicaciones del machine learning pueden ser de gran ayuda para ITSM. Algunas incluyen el análisis y mantenimiento predictivo, la planificación de la demanda, las capacidades de búsqueda mejoradas y las autorespuestas inteligentes.

Muchas de estas funcionalidades forman parte del motor de IA de InvGate, Support Assist. Supongamos que deseas comenzar a aprovechar el poder de la inteligencia artificial para potenciar las capacidades de tu help desk. En ese caso, te proponemos que lo pruebes, ya que se integra perfectamente en tu infraestructura de IT, mejorando los tiempos de primera respuesta y la precisión de los datos para optimizar el enrutamiento y la generación de informes.

Puntos clave

La conclusión principal de este artículo es que el machine learning llegó para quedarse. Porque el resultado suele ser asombrosamente preciso tanto si su proceso de aprendizaje es supervisado o no. Además, su aplicación correcta puede suponer el fin de las tareas tediosas y engorrosas, reduciendo así la carga de trabajo de los agentes y gerentes. 

Preguntas frecuentes

¿Cuáles son los cuatro fundamentos del machine learning?

Los 4 fundamentos del machine learning son: 

  1. Aprendizaje supervisado: se aplica cuando una máquina tiene datos de muestra, es decir, de entrada y salida con etiquetas. Entonces, comprueba las etiquetas para determinar si el modelo es correcto. El aprendizaje supervisado nos ayuda a predecir eventos futuros gracias a los ejemplos probados y etiquetados.

  2. Aprendizaje no supervisado: una máquina se entrena solo con algunas muestras de entrada o etiquetas, mientras que la salida no se conoce. La información de entrenamiento no está clasificada ni etiquetada, por lo que la máquina no siempre puede proporcionar la salida correcta en comparación con el aprendizaje supervisado.

  3. Aprendizaje por refuerzo: es una técnica del machine learning basada en la retroalimentación. Los agentes deben explorar el entorno y realizar acciones basadas en sus acciones. El aprendizaje por refuerzo es como entrenar a un cachorro para que haga trucos a cambio de golosinas.

  4. Aprendizaje semisupervisado: es una técnica intermedia entre el aprendizaje supervisado y el no supervisado. Realiza acciones en conjuntos de datos que tienen pocas etiquetas, así como en los que están sin etiquetar. Sin embargo, generalmente contiene datos sin etiquetar. Por lo tanto, también reduce el costo del modelo de aprendizaje automático ya que las etiquetas son costosas, aunque pueden tener pocas para fines corporativos. Por otra parte, también aumenta la precisión y el rendimiento del modelo.

¿Cuáles son las siete etapas del machine learning?

Las 7 etapas del machine learning son:

  • Recopilación de los datos
  • Preparación de los datos
  • Elección de un modelo
  • Entrenamiento del modelo
  • Evaluación del modelo
  • Ajuste de los parámetros
  • Realización de las predicciones

¿Cuáles son las tres partes del machine learning?

Las tres partes del machine learning son:

  1. Representación: cómo representar el conocimiento. Ejemplos: árboles de decisión, reglas, instancias, modelos gráficos, redes neuronales, máquinas de vectores soporte, conjuntos de modelos, etc.
  2. Evaluación: la forma de evaluar los programas candidatos (hipótesis). Ejemplos: precisión, predicción y recuperación, error al cuadrado, verosimilitud, probabilidad posterior, costo, margen, divergencia de entropía k-L y otros.
  3. Optimización: se conoce como proceso de búsqueda al modo en que se generan los programas candidatos. Ejemplos: optimización combinatoria, optimización convexa y optimización restringida.

¿Qué preguntas puede responder el machine learning?

Algunas preguntas que el machine learning puede responder si se entrena adecuadamente son:

  • ¿Cuánto o cuántos? - Esto puede usarse para la previsión o prueba de regresión (por ejemplo, "¿cuánto dinero voy a ganar el mes que viene en un distrito determinado por un producto concreto?" realiza pruebas de regresión durante el periodo de evaluación en el sistema de aprendizaje automático).

  • ¿Qué categoría? - ¿En qué categoría cae "X"? Un caso de uso cotidiano sería el análisis de sentimiento para determinar a qué tipo pertenece un tuit. Si menciona a tu empresa, ¿es bueno o malo?

  • ¿A qué grupo pertenece? - Se ubica en un algoritmo de agrupación. Estamos mirando a nuestros clientes o pacientes médicos. ¿Cómo se agrupan? Analizamos sus atributos y la forma de agruparlos. Esto nos permitirá considerar cómo acercarnos a ellos.

  • ¿Esto es raro o hay algo que no es normal? - La detección de anomalías. Por ejemplo, si estás usando tu tarjeta de crédito en un estado distinto de donde resides, la compañía te llama y te dice que es raro. ¿Debería seguir funcionando tu tarjeta?

  • ¿Qué opciones debemos tomar? - Una opción podría ser un modelo de recomendación. Basándonos en el historial de los datos, ¿cuál es la mejor alternativa de cara al futuro? Por ejemplo: la sugerencia de un producto en un sitio web como Amazon.