El machine learning o aprendizaje autom¨¢tico es una forma?de inteligencia artificial (AI) que hace posible que un sistema aprenda de los datos de forma iterativa mediante el uso de diferentes algoritmos para describirlos y predecir resultados gracias al aprendizaje de los datos de entrenamiento que produce modelos precisos.El hecho de tener equipos que sepan qu¨¦ hacer sin que nadie se lo diga expl¨ªcitamente es algo que ha ocupado la imaginaci¨®n de las personas durante mucho tiempo.
La idea de un coche en el que pueda montarse (en el asiento del conductor, por supuesto) y que se ocupe de toda la conducci¨®n, que identifique a los peatones y a los baches, y que responda de forma r¨¢pida y eficiente a los cambios en el entorno para llevarlo de forma segura a su destino ser¨ªa una forma de machine learning (ML) puesta en pr¨¢ctica.
?C¨®mo funciona? Vamos a comenzar analizando solamente los datos empresariales.
El ML es un tipo de IA que permite que las empresas aprendan de cantidades masivas de datos y les den sentido. Pongamos como ejemplo a Twitter. Seg¨²n Internet Live Stats, los usuarios de Twitter env¨ªan aproximadamente 500?millones de tweets a diario, lo que equivale a un total de aproximadamente 200?mil millones de tweets al a?o. No es humanamente posible analizar, clasificar, ordenar, descubrir y predecir nada con ese n¨²mero de tweets.
C¨®mo el machine learning puede ayudar a las empresas?
Machine Learning ayuda a proteger a las empresas de las ciberamenazas. Sin embargo, funciona mejor como parte de una soluci¨®n de seguridad multicapa.?
El machine learning requiere una considerable carga de trabajo por parte de las empresas para que estas obtengan informaci¨®n valiosa. Para sacar el m¨¢ximo provecho al ML debe tener datos limpios y tener claro qu¨¦ desea saber sobre ellos. Despu¨¦s podr¨¢ seleccionar el modelo y algoritmo que m¨¢s beneficien a su empresa. El ML no es un proceso simple ni sencillo. Para que tenga ¨¦xito es necesario un trabajo diligente.
El ML tiene un ciclo de vida:
El machine learning es una forma de que las empresas comprendan sus datos y aprendan de ellos. Una empresa puede utilizarlo para un gran n¨²mero de subcampos. El caso de uso depende de si una empresa est¨¢ intentando mejorar las ventas, proporcionar una caracter¨ªstica de b¨²squeda, integrar comandos de voz en su producto o crear un veh¨ªculo aut¨®nomo.
El ML tiene una fant¨¢stica variedad de usos en las empresas de hoy en d¨ªa y con el tiempo solo puede aumentar y mejorar. Los subcampos del ML incluyen recomendaciones de productos y redes sociales, reconocimiento de imagen, diagn¨®stico de salud, traducci¨®n de idiomas, reconocimiento de voz y miner¨ªa de datos, por mencionar algunos.
Las plataformas de redes sociales como Facebook, Instagram o LinkedIn utilizan el ML para sugerir qu¨¦ p¨¢ginas seguir o a qu¨¦ grupos unirse seg¨²n las publicaciones que le hayan gustado. Hacen falta datos hist¨®ricos sobre lo que les ha gustado a los dem¨¢s o qu¨¦ publicaciones son similares a aquellas que le han gustado a usted para realizar esas sugerencias o para a?adirlas a su actividad.??
Tambi¨¦n es posible utilizar el ML en un sitio de e-commerce para realizar recomendaciones seg¨²n adquisiciones anteriores, sus b¨²squedas y las acciones de otros usuarios similares a usted.
Un uso importante del ML hoy en d¨ªa es el reconocimiento de imagen. Las plataformas de las redes sociales han recomendado etiquetar a las personas en sus fotos con base en el ML. La polic¨ªa ha podido utilizarla para buscar a sospechosos en fotograf¨ªas o en v¨ªdeos. Debido a la gran cantidad de c¨¢maras instaladas en los aeropuertos, tiendas y portales, es posible averiguar qui¨¦n ha cometido un crimen o a d¨®nde ha ido el criminal.
Los diagn¨®sticos de salud tambi¨¦n son un buen uso del ML. Despu¨¦s de un suceso como un ataque al coraz¨®n, es posible retroceder y ver se?ales de alarma que se pasaron por alto. Un sistema utilizado por m¨¦dicos u hospitales podr¨ªa ser utilizar historias cl¨ªnicas del pasado y aprender a ver las conexiones desde el inicio (comportamiento, resultado de pruebas o s¨ªntomas) hasta el resultado (p.?ej.: un ataque al coraz¨®n). A continuaci¨®n, cuando el m¨¦dico introduzca sus notas y los resultados de las pruebas en el sistema en el futuro, la m¨¢quina podr¨¢ detectar s¨ªntomas de un ataque al coraz¨®n de una forma mucho m¨¢s fiable que los humanos para que as¨ª tanto paciente como m¨¦dico puedan realizar cambios y evitarlo.
La traducci¨®n de idiomas en las p¨¢ginas web o en las aplicaciones para plataformas m¨®viles es otro ejemplo de ML. Algunas aplicaciones lo hacen mejor que otras, lo cual tiene que ver con los algoritmos, la t¨¦cnica y el modelo de ML que utilizan.
Un uso diario del ML hoy en d¨ªa se puede ver en las operaciones bancarias y en las tarjetas de cr¨¦dito. Hay signos de fraude que el ML puede detectar r¨¢pidamente y que a los humanos les costar¨ªa un largo tiempo descubrir, si es que llegan a hacerlo. La gran cantidad de transacciones que se han examinado y catalogado (siendo fraude o no) puede permitir al ML detectar un fraude en el futuro en una sola transacci¨®n. La miner¨ªa de datos es un ML fant¨¢stico para hacer esto.
La miner¨ªa de datos es un tipo de ML que analiza los datos para realizar predicciones o para descubrir patrones en grandes cantidades de datos. El t¨¦rmino es un poco confuso ya que no es necesario que nadie, sea un agente malicioso o un empleado, rebusque entre sus datos para que encuentre alg¨²n dato que sea ¨²til. En su lugar, el proceso hace que el descubrimiento de patrones sea ¨²til para tomar decisiones en el futuro.
Pongamos, por ejemplo, una empresa de tarjetas de cr¨¦dito. Si usted tiene una tarjeta de cr¨¦dito, su banco seguramente le ha avisado de una actividad sospechosa con su tarjeta en alguna ocasi¨®n. ?C¨®mo detecta el banco ese tipo de actividad tan r¨¢pido y env¨ªa una alerta pr¨¢cticamente instant¨¢nea? Lo que permite esta protecci¨®n frente al fraude es una miner¨ªa de datos continua. A principios de?2020 hab¨ªa m¨¢s de 1100?millones de tarjetas emitidas solamente en EE.?UU. El n¨²mero de transacciones desde esas tarjetas produce diferentes datos para la miner¨ªa, b¨²squeda de patrones y el aprendizaje, y as¨ª identificar transacciones sospechosas en el futuro.
El aprendizaje profundo es un tipo de ML espec¨ªfico que se basa en redes neuronales. Una red neuronal funciona para emular el funcionamiento de las neuronas en un cerebro humano y as¨ª tomar una decisi¨®n o entender algo. Por ejemplo, un ni?o de seis a?os puede mirar un rostro y distinguir entre su madre y el guardia de cruce porque el cerebro analiza muchos detalles r¨¢pidamente (color de pelo, rasgos faciales, cicatrices, etc.), todo en un solo pesta?eo. El machine learning reproduce esto con el aprendizaje profundo.
Una red neuronal tiene entre?3 y 5?capas: una capa de entrada, entre una y tres capas ocultas, y una capa de salida. Las capas ocultas toman las decisiones una por una para trabajar hacia la capa de salida o la conclusi¨®n. ?Qu¨¦ color de pelo? ?Qu¨¦ color de ojos? ?Hay alguna cicatriz? Como las capas aumentan hasta ser cientos de ellas, se llama aprendizaje profundo.
Hay 4?tipos principales de algoritmos de machine learning: supervisado, semisupervisado, no supervisado y de refuerzo. Los expertos en ML creen que aproximadamente un 70?% de los algoritmos de ML que se utilizan hoy en d¨ªa son supervisados. Trabajan con conjuntos de datos catalogados o conocidos (por ejemplo, fotograf¨ªas de perros y gatos). Estos dos tipos de animales son conocidos, as¨ª que los administradores pueden catalogar las fotograf¨ªas antes de d¨¢rselas al algoritmo.
Los algoritmos de ML no supervisado aprenden de conjuntos de datos desconocidos. Por ejemplo, los v¨ªdeos de TikTok. Hay tanta cantidad de v¨ªdeos de tantos temas diferentes que es imposible entrenar a un algoritmo a partir de ellos de manera supervisada, los datos a¨²n no se han catalogado.
Los algoritmos de ML semisupervisados se entrenan inicialmente con un peque?o conjunto de datos conocido y catalogado. A continuaci¨®n, se aplica a un conjunto de datos m¨¢s grande sin catalogar para continuar su entrenamiento.
Los algoritmos de ML de refuerzo no est¨¢n entrenados inicialmente. Aprenden del ensayo y error sobre la marcha. Piense en un robot que est¨¢ aprendiendo a hacerse camino sobre un mont¨®n de rocas. Cada vez que se cae aprende qu¨¦ es lo que no funciona y cambia su comportamiento hasta tener ¨¦xito. Piense en el entrenamiento de un perro y en el uso de los premios para ense?ar diferentes ¨®rdenes. Gracias a un refuerzo positivo el perro continuar¨¢ obedeciendo las ¨®rdenes y cambiar¨¢ aquel comportamiento que no le proporcione una respuesta favorable.??
Utiliza conjuntos de datos clasificados, establecidos y conocidos para encontrar patrones. Ampliemos la idea anterior de las im¨¢genes de perros y gatos. Usted podr¨ªa tener un conjunto de datos gigante lleno de cientos de diferentes animales en millones de im¨¢genes. Como conocemos los tipos de animales, estos se podr¨ªan haber agrupado y catalogado antes de proporcion¨¢rselos al algoritmo de ML supervisado para que este aprenda a comprender.
Ahora el algoritmo supervisado compara la entrada con la salida y la fotograf¨ªa con la clasificaci¨®n del tipo de animal. Con el tiempo aprender¨¢ a reconocer un tipo concreto de animal en las fotograf¨ªas nuevas que se encuentre.
Los algoritmos de ML no supervisado son como los filtros de spam de hoy en d¨ªa. Al principio los administradores pod¨ªan programar los filtros de spam para que buscase palabras concretas en un email para comprender el spam. Esto ya no es posible, por lo que el algoritmo no supervisado funciona bien aqu¨ª. El algoritmo de ML no supervisado se compone de emails que no se han catalogado para empezar a buscar patrones. A medida que va encontrando esos patrones aprender¨¢ cu¨¢l es el aspecto del spam y c¨®mo identificarlo en el entorno de la producci¨®n.
Otro tipo es el machine learning basado en instancias, que correlaciona los datos reci¨¦n encontrados con los datos de entrenamiento y crea hip¨®tesis basadas en la correlaci¨®n. Para ello, el machine learning basado en instancias utiliza m¨¦todos de emparejamiento r¨¢pidos y eficaces para hacer referencia a los datos de entrenamiento almacenados y compararlos con datos nuevos nunca antes vistos. Utiliza instancias espec¨ªficas y calcula puntuaciones de distancia o similitudes entre instancias espec¨ªficas e instancias de entrenamiento para crear una predicci¨®n. Un modelo de machine learning basado en instancias es ideal por su capacidad de adaptarse y aprender de datos no vistos anteriormente.?
Las t¨¦cnicas de ML solucionan problemas. Dependiendo del problema al que se enfrente, elija una t¨¦cnica de ML concreta. Aqu¨ª est¨¢n las 6?m¨¢s comunes.
La regresi¨®n se puede utilizar para predecir los precios de mercado de la vivienda o para determinar el mejor precio de venta de una pala para la nieve en Minnesota en diciembre. La regresi¨®n dice que, aunque los precios fluct¨²en, siempre regresar¨¢n a su precio medio, aunque con el tiempo los precios de las viviendas est¨¦n aumentando, hay una media que siempre volver¨¢ a suceder. Puede trazar los precios a lo largo del tiempo en un gr¨¢fico y encontrar la media a medida que pasa el tiempo. Si la l¨ªnea roja sigue apareciendo en la gr¨¢fica, ser¨¢ posible hacer predicciones futuras.
La clasificaci¨®n se utiliza para agrupar los datos en categor¨ªas conocidas. Puede estar buscando clientes que previsiblemente sean buenos clientes (siempre vuelven y se gastan m¨¢s dinero) o que previsiblemente vayan a empezar a comprar en otro sitio. Si puede mirar atr¨¢s en el tiempo y encontrar indicadores para cada clasificaci¨®n de clientes, los aplicar¨¢ a clientes actuales y predecir¨¢ en qu¨¦ grupo encajar¨¢n. Entonces ser¨¢ capaz de promocionarse de forma m¨¢s efectiva y posiblemente convertir a los clientes potenciales que podr¨ªan irse en unos clientes geniales que vuelven. Este es un buen ejemplo de un ML supervisado.
A diferencia de la t¨¦cnica de clasificaci¨®n, la agrupaci¨®n es un ML no supervisado. En la agrupaci¨®n, el sistema encontrar¨¢ la forma de agrupar los datos que usted no sabe c¨®mo agrupar. Este tipo de ML es excelente para analizar im¨¢genes m¨¦dicas, para analizar redes sociales o para buscar anomal¨ªas.
la agrupaci¨®n para la generalizaci¨®n, la compresi¨®n de datos y la preservaci¨®n de la privacidad en productos como los v¨ªdeos de YouTube, las aplicaciones de Play y las pistas de Music.
La detecci¨®n de anomal¨ªas se utiliza cuando est¨¢ buscando valores at¨ªpicos, como detectar la oveja negra en un reba?o. Cuando buscamos en una cantidad masiva de datos, es imposible que un humano encuentre este tipo de anomal¨ªas. Pero, por ejemplo, si un cient¨ªfico de datos aliment¨® los datos de un sistema de facturaci¨®n m¨¦dica de diferentes hospitales, la detecci¨®n de anomal¨ªas encontrar¨ªa una forma de agrupar la facturaci¨®n. Podr¨ªa descubrir un conjunto de valores at¨ªpicos que resulten ser donde ocurren los fraudes.
La l¨®gica de los an¨¢lisis de la cesta de la compra permite predicciones futuras. Un ejemplo sencillo: si los clientes a?aden carne picada, tomates y tacos a su cesta, usted podr¨ªa predecir que a?adir¨¢n queso y crema agria. Estas predicciones se pueden utilizar para generar ventas adicionales al realizar sugerencias valiosas para los compradores online sobre los productos que podr¨ªan haber olvidado o para ayudar a agrupar los productos en una tienda.
Dos profesores del MIT utilizaron este enfoque para descubrir el ??. Al parecer, a algunos clientes les gustan los productos que fallan. Si puede detectarlos, puede determinar si continuar vendi¨¦ndole un producto y qu¨¦ tipo de marketing aplicar para aumentar las ventas con los clientes adecuados.
Los datos de series temporales se suelen recopilar sobre muchos de nosotros gracias a los monitores de aptitud f¨ªsica de nuestras mu?ecas. Puede recopilar las pulsaciones por minuto, cu¨¢ntos pasos damos por minuto u hora y algunos ahora incluso miden la saturaci¨®n de ox¨ªgeno a lo largo del tiempo. Con estos datos podr¨ªa ser posible predecir cu¨¢ndo alguien va a ir a correr en el futuro. Tambi¨¦n ser¨ªa posible recopilar datos sobre maquinaria y predecir el fallo debido a los datos con base en el tiempo sobre el nivel de vibraci¨®n, el nivel de los decibelios de ruido y la presi¨®n.
Si se supone que el ML aprende de los datos, ?c¨®mo dise?a un algoritmo para aprender y encontrar los datos estad¨ªsticamente importantes? Los algoritmos de ML admiten el proceso del ML de refuerzo, no supervisado o supervisado.
Los ingenieros de datos escriben fragmentos de c¨®digo que son algoritmos que permiten que un equipo aprenda o encuentre importancia en los datos
Vamos a ver algunos algoritmos concretos que son lo m¨¢s comunes. Aqu¨ª tenemos los 5?mejores en uso hoy en d¨ªa.
Tras combinar el tipo de ML (supervisado, no supervisado, etc.), las t¨¦cnicas y los algoritmos, el resultado es un archivo que se ha entrenado. Ahora a este archivo se le puede proporcionar datos nuevos y ser¨¢ capaz de crear patrones de reconocimiento y realizar predicciones o tomar decisiones para la empresa, el director o el cliente a demanda.
Los lenguajes de machine learning son la forma en la que se escriben las instrucciones para que el sistema aprenda. Cada lenguaje tiene una comunidad de usuarios de soporte de los que aprender o para guiar a otros. Hay bibliotecas incluidas en cada lenguaje para el uso del machine learning.
Aqu¨ª est¨¢n los 10?mejores seg¨²n GitHub .
Como Python es el lenguaje de ML m¨¢s com¨²n, aqu¨ª hablamos un poco m¨¢s sobre ¨¦l.
Python es un lenguaje orientado a objetos, e interpretado que le debe su nombre a los Monty Python. Como es interpretado, se convierte a c¨®digos de bytes antes de que sea ejecutable mediante una m¨¢quina virtual de Python.
Hay una variedad de caracter¨ªsticas que hacen que Python sea la opci¨®n preferida para el ML.
La aparici¨®n del ransomware ha puesto el machine learning en el centro de atenci¨®n, dada su capacidad para detectar ataques de ransomware en el momento cero.?
?La evoluci¨®n es el juego del malware. Hace unos a?os, los atacantes utilizaban el mismo malware con el mismo valor hash, la huella dactilar de un malware, varias veces antes de aparcarlo permanentemente. Hoy en d¨ªa, estos atacantes utilizan algunos tipos de malware que generan valores hash ¨²nicos con frecuencia. Por ejemplo, el ransomware Cerber puede generar una nueva variante de malware, con un nuevo valor hash cada 15 segundos. Esto significa que estos malware se utilizan solo una vez, lo que hace que sean extremadamente dif¨ªciles de detectar utilizando t¨¦cnicas antiguas. Introduzca machine learning. Gracias a la capacidad del machine learning para detectar dichos formularios de malware basados en el tipo de familia, sin duda es una herramienta de ciberseguridad l¨®gica y estrat¨¦gica.??
Los algoritmos de machine learning pueden realizar predicciones precisas basadas en la experiencia previa con programas maliciosos y amenazas basadas en archivos. Al analizar millones de diferentes tipos de ciberriesgos conocidos, el machine learning es capaz de identificar ataques nuevos o sin clasificar que comparten similitudes con los conocidos.?
?Desde la predicci¨®n de nuevo malware basado en datos hist¨®ricos hasta el seguimiento eficaz de amenazas para bloquearlas, el machine learning demuestra su eficacia en ayudar a las soluciones de ciberseguridad a reforzar la postura general de ciberseguridad.?
?Y aunque el machine learning se ha convertido en un punto de debate importante en ciberseguridad recientemente, ya ha sido una herramienta integrada en las soluciones de seguridad de live casino online desde 2005, mucho antes de que comenzara el rumor.?
Conozca a fondo nuestro centro de IA, donde convergen la seguridad de alto nivel y la tecnolog¨ªa innovadora. Conozca c¨®mo la IA empodera a los equipos de seguridad a predecir, anticipar y detectar amenazas r¨¢pidamente. Compruebe de forma peri¨®dica en busca de recursos actualizados sobre el impacto transformador de la IA en materia de ciberseguridad, ayud¨¢ndole a mantenerse por delante de las amenazas emergentes y a implementar de forma segura las soluciones de IA.
Recursos