7 algoritmos de machine learning que hay que conocer: Gu铆a para principiantes

Written by 糖心vlog官网观看鈥� Updated on Jun 16, 2023

Los algoritmos de aprendizaje autom谩tico impulsan muchos servicios en el mundo actual. Aqu铆 tienes siete que debes conocer para iniciar tu carrera profesional.

[Imagen destacada] Dos profesionales del aprendizaje autom谩tico discuten sobre algoritmos de aprendizaje autom谩tico.

Read in English. (Leer en ingl茅s.)

El aprendizaje autom谩tico (machine learning, ML) puede hacer de todo, desde analizar radiograf铆as hasta predecir cotizaciones burs谩tiles o recomendar programas de televisi贸n que merezcan la pena. Con una gama tan amplia de aplicaciones, no es de extra帽ar que se prevea que el mercado mundial del aprendizaje autom谩tico crezca de $21,700 millones de d贸lares estadounidenses (approx. 415,741,837 pesos mexicanos) en 2022 a 209,910 millones de d贸lares (approx. 4,021,583,825 pesos) en 2029, seg煤n Fortune Business Insights [].

En el n煤cleo del aprendizaje autom谩tico se encuentran los algoritmos, que se entrenan para convertirse en los modelos de aprendizaje autom谩tico utilizados para impulsar algunas de las innovaciones m谩s impactantes del mundo actual. En este art铆culo, aprender谩s sobre siete de los algoritmos de ML m谩s importantes que debes conocer al comenzar tu propio aprendizaje del aprendizaje autom谩tico y explorar谩s los diferentes estilos de aprendizaje que se usan para convertir algoritmos de ML en modelos de ML.

Principales algoritmos de aprendizaje autom谩tico que debes conocer

Los algoritmos de aprendizaje autom谩tico son los componentes fundamentales de los modelos de aprendizaje autom谩tico. Desde la clasificaci贸n hasta la regresi贸n, aqu铆 hay siete algoritmos que debes conocer al comenzar tu carrera de aprendizaje autom谩tico:

1. Regresi贸n lineal

La regresi贸n lineal (linear regression) es un algoritmo de aprendizaje supervisado que se utiliza para predecir y pronosticar valores dentro de un rango continuo, como cifras de ventas o precios.

Procedente de la estad铆stica, la regresi贸n lineal desempe帽a una tarea de regresi贸n (regression task), que asigna una pendiente constante utilizando un valor de entrada (X) con una variable de salida (Y) para predecir un valor num茅rico o una cantidad. La regresi贸n lineal usa datos etiquetados para hacer predicciones estableciendo una l铆nea de mejor ajuste (line of best fit), o 鈥渓铆nea de regresi贸n鈥�, que se aproxima a partir de un diagrama de dispersi贸n de puntos de datos. Como resultado, la regresi贸n lineal se emplea para el modelado predictivo m谩s que para la categorizaci贸n.

2. Regresi贸n log铆stica

La regresi贸n log铆stica (logistic regression), o 鈥渞egresi贸n logit鈥�, es un algoritmo de aprendizaje supervisado utilizado para la clasificaci贸n binaria, como decidir si una imagen encaja en una clase u otra.

Originaria de la estad铆stica, la regresi贸n log铆stica predice t茅cnicamente la probabilidad de que una entrada pueda clasificarse en una 煤nica clase primaria. En la pr谩ctica, sin embargo, puede emplearse para agrupar las salidas en una de dos categor铆as: 鈥渃lase primaria鈥� (鈥渢he primary class鈥�) o 鈥渃lase secundaria鈥� (鈥渘ot the primary class鈥�). Esto se consigue creando un rango para la clasificaci贸n binaria, de forma que cualquier salida entre 0 y 0,49 se incluya en un grupo y cualquier salida entre 0,50 y 1,00 se incluya en otro.

Como resultado, la regresi贸n log铆stica en el aprendizaje autom谩tico se utiliza normalmente para la categorizaci贸n binaria en lugar de para el modelado predictivo.聽

3. Clasificador bayesiano ingenuo

El clasificador bayesiano ingenuo o 鈥�Naive Bayes鈥� es un conjunto de algoritmos de aprendizaje supervisado que se utilizan para crear modelos predictivos de categorizaci贸n binaria o m煤ltiple. Basado en el Teorema de Bayes, Naive Bayes opera con probabilidades condicionales, que son independientes entre s铆, pero indican la probabilidad de una clasificaci贸n basada en sus factores combinados.

Por ejemplo, un programa ingeniado para identificar plantas podr铆a usar un algoritmo de Bayes ingenuo para clasificar im谩genes en funci贸n de factores concretos, como el tama帽o, el color y la apariencia percibida. Aunque cada uno de estos factores es independiente del otro, el algoritmo anotar铆a la probabilidad de que un objeto sea una planta concreta utilizando los factores combinados.

4. 脕rbol de decisi贸n

Un 谩rbol de decisi贸n (decision tree) es un algoritmo de aprendizaje supervisado utilizado para la clasificaci贸n y el modelado predictivo.

Semejante a un diagrama de flujo gr谩fico, un 谩rbol de decisi贸n comienza con un nodo ra铆z, que formula una pregunta concreta a los datos y luego los env铆a por una rama en funci贸n de la respuesta. Cada una de estas ramas conduce a un nodo interno, que a su vez formula otra pregunta a los datos antes de dirigirlos hacia otra rama en funci贸n de la respuesta. Esto contin煤a hasta que los datos llegan a un nodo final, tambi茅n llamado nodo hoja, que no se ramifica m谩s.

Los 谩rboles de decisi贸n son habituales en el aprendizaje autom谩tico porque pueden manejar conjuntos de datos complejos con relativa sencillez.

5. Algoritmo de bosque aleatorio

Un algoritmo de bosque aleatorio (random forest algorithm) utiliza un conjunto de 谩rboles de decisi贸n para la clasificaci贸n y el modelado predictivo.聽

En un bosque aleatorio, muchos 谩rboles de decisi贸n (a veces cientos o incluso miles) se entrenan utilizando una muestra aleatoria del conjunto de entrenamiento (un m茅todo conocido como bagging). Despu茅s, los investigadores introducen los mismos datos en cada 谩rbol de decisi贸n del bosque aleatorio y cuentan sus resultados finales. Luego se selecciona el resultado m谩s com煤n como el m谩s probable para el conjunto de datos.

Aunque pueden llegar a ser complejos y requerir mucho tiempo, los bosques aleatorios corrigen el problema com煤n del 鈥�sobreajuste鈥� (overfitting) que puede producirse con los 谩rboles de decisi贸n. Se habla de sobreajuste cuando un algoritmo se ajusta demasiado a su conjunto de datos de entrenamiento, lo que puede repercutir negativamente en su precisi贸n cuando se introduce posteriormente en nuevos datos.聽

6. Algoritmo K-Nearest neighbor (KNN)

Un algoritmo K-Nearest neighbor es un algoritmo de aprendizaje supervisado que se usa para la clasificaci贸n y el modelado predictivo.聽

Fieles a su nombre, los algoritmos KNN clasifican una salida por su proximidad a otras salidas en un gr谩fico. Por ejemplo, si una salida est谩 m谩s cerca de un grupo de puntos azules en un gr谩fico que de un grupo de puntos rojos, se clasificar铆a como miembro del grupo azul. Este enfoque significa que los algoritmos KNN pueden utilizarse tanto para clasificar resultados conocidos como para predecir el valor de resultados desconocidos.

7.聽 Algoritmo K means

K means es un algoritmo no supervisado que se emplea para la clasificaci贸n y el modelado predictivo.

Al igual que KNN, K means utiliza la proximidad de un resultado a un conglomerado de puntos de datos para identificarlo. Cada uno de los conglomerados est谩 definido por un centroide, un punto central real o imaginario del conglomerado. K means es 煤til en grandes conjuntos de datos, especialmente para la agrupaci贸n, aunque puede fallar cuando maneja valores at铆picos.

Entrenamiento de algoritmos de aprendizaje autom谩tico: Cuatro m茅todos

Todo el mundo aprende de forma diferente, incluidas las m谩quinas. En esta secci贸n, aprender谩s sobre cuatro estilos de aprendizaje diferentes usados para entrenar algoritmos de aprendizaje autom谩tico: aprendizaje supervisado, aprendizaje no supervisado, aprendizaje de refuerzo y aprendizaje semisupervisado.

Aprendizaje supervisado

Un algoritmo de aprendizaje supervisado (supervised learning algorithm) utiliza un conjunto de datos etiquetados para entrenar un algoritmo, garantizando de manera efectiva que tiene una clave de respuesta disponible para cruzar las predicciones y refinar su sistema. Como resultado, el aprendizaje supervisado es el m谩s adecuado para algoritmos que se enfrentan a un resultado espec铆fico en mente, como la clasificaci贸n de im谩genes.

Por ejemplo, un algoritmo destinado a identificar distintos tipos de plantas podr铆a entrenarse utilizando im谩genes ya etiquetadas con sus nombres (por ejemplo, 鈥渞osa鈥�, 鈥渃alabaza鈥� o 鈥渁loe vera鈥�). Mediante el aprendizaje supervisado, el algoritmo ser铆a capaz de identificar las caracter铆sticas diferenciadoras de cada clasificaci贸n de plantas de forma eficaz y, con el tiempo, hacer lo mismo con un conjunto de datos sin etiquetar.

Al igual que un profesor supervisa a sus alumnos en clase, los datos etiquetados tambi茅n supervisan las soluciones del algoritmo y las dirigen hacia la respuesta correcta.聽

Aprendizaje no supervisado聽

Un algoritmo de aprendizaje no supervisado (unsupervised learning algorithm) utiliza un conjunto de datos no etiquetados para entrenar un algoritmo, que debe analizar los datos para identificar caracter铆sticas distintivas, estructuras y anomal铆as. A diferencia del aprendizaje supervisado, los investigadores utilizan el aprendizaje no supervisado cuando no tienen un resultado espec铆fico en mente, sino que utilizan el algoritmo para agrupar datos e identificar patrones, asociaciones o anomal铆as.

Por ejemplo, una empresa puede alimentar un algoritmo de aprendizaje no supervisado con datos de clientes sin etiquetar para segmentar su mercado objetivo. Una vez establecida una segmentaci贸n clara de los clientes, la empresa podr铆a usar estos datos para dirigir sus futuros esfuerzos de marketing, como el marketing en redes sociales.

El aprendizaje no supervisado es como si un alumno resolviera por s铆 mismo un problema sin la supervisi贸n de un profesor.

Aprendizaje por refuerzo

En el aprendizaje por refuerzo (reinforcement learning), una m谩quina o agente de inteligencia artificial o IA intenta realizar una tarea, recibe informaci贸n mientras la realiza y luego repite un nuevo enfoque hasta que ha encontrado la soluci贸n 贸ptima. Como resultado, el aprendizaje por refuerzo es similar a la forma en que un ni帽o aprende a desenvolverse en un entorno nuevo: primero explora, luego interact煤a con 茅l y, con el tiempo, aprende a desenvolverse sin problemas en el espacio.

Debido a los bucles de retroalimentaci贸n (feedback loops) necesarios para desarrollar estrategias cada vez mejores, el aprendizaje por refuerzo se utiliza a menudo en entornos de videojuegos en los que las condiciones pueden controlarse y la retroalimentaci贸n es fiable. Con el tiempo, la m谩quina o IA aprende a trav茅s de la acumulaci贸n de retroalimentaci贸n hasta que consigue el camino 贸ptimo hacia su objetivo.

Aprendizaje semisupervisado

El aprendizaje semisupervisado (semi-supervised learning o SSL) entrena algoritmos utilizando una peque帽a cantidad de datos etiquetados junto con una mayor cantidad de datos sin etiquetar. El aprendizaje semisupervisado se utiliza a menudo para categorizar grandes cantidades de datos sin etiquetar porque podr铆a ser inviable o demasiado dif铆cil etiquetar todos los datos por s铆 mismo.

Normalmente, un investigador que utilice SSL entrenar谩 primero un algoritmo con una peque帽a cantidad de datos etiquetados antes de entrenarlo con una gran cantidad de datos sin etiquetar. Por ejemplo, un algoritmo SSL que analice el habla podr铆a entrenarse primero con fragmentos de sonido etiquetados antes de entrenarse con sonidos no etiquetados, que probablemente var铆en en tono y estilo con respecto a los datos etiquetados.

You are Currently on slide 1

Aprende m谩s sobre el aprendizaje autom谩tico

Una carrera en el aprendizaje autom谩tico empieza por aprender todo lo que pueda sobre 茅l. Al fin y al cabo, incluso los mejores modelos de aprendizaje autom谩tico necesitan cierta formaci贸n previa.

Para comenzar tu propia formaci贸n, puedes considerar cursar la Especializaci贸n en Aprendizaje Autom谩tico para principiantes de Andrew Ng para dominar los conceptos fundamentales de la IA y desarrollar habilidades pr谩cticas de aprendizaje autom谩tico. Por su parte, la Especializaci贸n en Aprendizaje Profundo de DeepLearning.AI ense帽a a los alumnos a crear y entrenar redes neuronales profundas. Por 煤ltimo, puedes obtener un Certificado profesional de Automatizaci贸n de TI de Google con Python si deseas continuar expandiendo tus conocimientos de automatizaci贸n.

Article sources

Fortune Business Insights. 鈥�, https://www.fortunebusinessinsights.com/machine-learning-market-102226鈥�. Consultado el 2 de diciembre de 2022.

Keep reading

Updated on Jun 16, 2023

Written by:

糖心vlog官网观看

Writer

糖心vlog官网观看 is the global online learning platform that offers anyone, anywhere access to online course...

This content has been made available for informational purposes only. Learners are advised to conduct additional research to ensure that courses and other credentials pursued meet their personal, professional, and financial goals.