Big data es la nueva y enorme cantidad de datos que pueden estudiarse para mostrar patrones, tendencias y asociaciones.
Read in English. (Leer en ingl茅s.)
El t茅rmino big data hace referencia a grandes conjuntos de datos que pueden estudiarse para revelar patrones, tendencias y asociaciones. La gran cantidad de v铆as de recopilaci贸n de datos que existen significa que ahora los datos pueden venir en mayores cantidades, reunirse mucho m谩s r谩pidamente y existir en una mayor variedad de formatos diferentes que antes. Estos nuevos datos, m谩s grandes y complejos, se denominan colectivamente big data.
Aunque no existe un l铆mite que separe el big data de los datos tradicionales, en general se considera que el big data es "grande" porque no puede ser procesado con suficiente eficacia y rapidez por las antiguas herramientas de an谩lisis de datos.
El big data se define mayormente por las tres Vs: volumen, velocidad y variedad.
El volumen se refiere a la cantidad de datos. El big data se ocupa de grandes vol煤menes de datos.
La velocidad se refiere al ritmo al que se reciben los datos. Los big data fluyen a gran velocidad, y a menudo pasan directamente a la memoria en lugar de almacenarse en un disco.
La variedad se refiere a la amplia gama de formatos de datos. Los big data pueden ser estructurados, semi estructurados o no estructurados, y pueden presentarse como n煤meros, textos, im谩genes, audios, etc.
Las empresas que procesan big data tambi茅n pueden centrarse en otras variables, como el valor, la veracidad y la variabilidad.
Las nuevas tecnolog铆as de la informaci贸n han permitido recoger, almacenar y analizar datos a una escala sin precedentes. El Internet contin煤a siendo adoptado por nuevos usuarios en M茅xico y en todo el mundo, y las tecnolog铆as en desarrollo han permitido la integraci贸n del Internet en muchos productos diferentes, creando numerosas fuentes nuevas de datos. Los millones de personas que ven Netflix, utilizan Google o compran productos en l铆nea cada d铆a contribuyen al creciente volumen y sofisticaci贸n del big data.
Big data puede proceder de:
Dispositivos inteligentes (Internet de las cosas, o IoT): La conexi贸n al Internet permite a las empresas recopilar datos a trav茅s de dispositivos como los sistemas dom茅sticos inteligentes, las aspiradoras rob贸ticas, los televisores inteligentes, los dispositivos m贸viles y los rastreadores ponibles de fitness que registran archivos.
Redes sociales: Los "me gusta", los "compartidos", las "publicaciones", los "comentarios", el tiempo que se pasa mirando un "post"鈥攖oda esta informaci贸n se considera un dato revelador del comportamiento, el sentimiento y las preferencias de las personas.
Sitios web: Las empresas u otros propietarios de sitios web pueden rastrear las visitas a las p谩ginas, la ubicaci贸n general de los visitantes, ver cu谩nto tiempo pasa el p煤blico en una p谩gina, qu茅 enlaces son los m谩s pulsados y el movimiento del cursor.
Transacciones comerciales: Los datos pueden proceder de los clientes cuando compran productos, en l铆nea y en persona. El precio, el momento de la compra, los m茅todos de pago y otros detalles pueden informar a una empresa sobre la demanda de sus productos por parte de los clientes.
Maquinaria: Incluso sin conexi贸n al Internet, m谩quinas como c谩maras de carretera, sensores y equipos m茅dicos pueden registrar informaci贸n.
Atenci贸n sanitaria: El sistema de salud est谩 lleno de datos. Los analistas de datos pueden utilizar la informaci贸n agregada de los registros de salud, los seguros y los res煤menes de los pacientes para obtener nuevas perspectivas y mejorar la atenci贸n al paciente.
Administraci贸n p煤blica: Los gobiernos municipales, estatales y federales pueden utilizar datos de muchas fuentes鈥攊nformaci贸n sobre el tr谩fico de autom贸viles, rendimientos agr铆colas, sistemas de seguimiento meteorol贸gico, informaci贸n demogr谩fica de los censos, por nombrar algunas鈥攑ara tomar decisiones pol铆ticas.
Casi todas las entidades pueden utilizar big data para obtener informaci贸n valiosa y tomar decisiones sobre sus operaciones. Una empresa, por ejemplo, puede analizar los datos que recopila para comprender mejor las preferencias de los clientes y dise帽ar estrategias comerciales impactantes. Los datos masivos en los sistemas sanitarios pueden utilizarse para encontrar los s铆ntomas comunes de las enfermedades, o para decidir cu谩nto personal poner en una planta de hospital en un momento dado. Los gobiernos pueden utilizar los datos de tr谩fico para planificar nuevas carreteras, o rastrear los 铆ndices de criminalidad o los riesgos de terrorismo para ajustar su respuesta en consecuencia.
Si trabajas como analista de datos o en otro campo que trabaje con big data, puedes utilizar las siguientes herramientas y m茅todos:
An谩lisis predictivo: Utiliza los datos para predecir la probabilidad de eventos o tendencias en el futuro mediante el uso de modelos predictivos y tecnolog铆a de aprendizaje autom谩tico.
An谩lisis en tiempo real: Analiza y utiliza los datos en el momento en que entran en una base de datos para tomar decisiones r谩pidamente, como cuando un sistema bancario marca un pago como potencialmente fraudulento cuando se realiza fuera del pa铆s.
Miner铆a de datos: Revisa enormes cantidades de datos para encontrar patrones, tendencias y correlaciones. Encontrar relaciones entre puntos de datos es clave para ayudar a las organizaciones a tomar decisiones.
Aprendizaje autom谩tico: Predice tendencias y encuentra patrones en grandes conjuntos de datos con el aprendizaje autom谩tico鈥攗na forma de inteligencia artificial que aprende y mejora continuamente. El aprendizaje autom谩tico puede ser 煤til para adaptarse a los nuevos flujos de datos.
Aprendizaje profundo: El aprendizaje profundo es un subconjunto del aprendizaje autom谩tico que se basa en redes neuronales artificiales e imita el proceso de aprendizaje del cerebro humano. Utiliza a menudo el aprendizaje profundo en el reconocimiento de voz y texto, y en la tecnolog铆a de visi贸n por ordenador.
Almacenes de datos: Los almacenes de datos almacenan cantidades masivas de datos hist贸ricos. Los datos suelen estar limpios y organizados, y se pueden acceder posteriormente para analizarlos.
Hadoop: Hadoop es un marco de software que puedes utilizar para almacenar y procesar grandes cantidades de datos que pueden funcionar en varios grupos (clusters) de computadoras. La capacidad de Hadoop de ser escalado f谩cilmente y de almacenar varios tipos de datos a la vez lo han convertido en la plataforma preferible para procesar big data.
Apache Spark: Apache Spark es un marco de software que combina el an谩lisis de datos con la inteligencia artificial. Puede analizar grandes conjuntos de datos m谩s r谩pidamente en muchos casos que Hadoop.
Las profesiones relacionadas con los datos鈥攁nalistas y cient铆ficos de datos, especialistas en IA y aprendizaje autom谩tico, y especialistas en big data鈥攐cuparon los tres primeros puestos en la lista del Foro Econ贸mico Mundial de los principales puestos de trabajo con mayor demanda en todos los sectores en 2020 []. A continuaci贸n, se describen los puestos de trabajo que utilizan el big data en diferentes capacidades.
Analista de datos: Un trabaja para recopilar, limpiar e interpretar datos y crear modelos de datos. Los analistas de datos pueden trabajar en una gran variedad de sectores, como el empresarial, el cient铆fico y el sanitario.
Ingeniero de datos: Los ingenieros de datos trabajan para crear y mantener la infraestructura de datos. Esto puede incluir almacenes de datos, conductos de datos y otras formas de organizar los datos que los analistas pueden utilizar para hacer predicciones u otras interpretaciones.
Cient铆fico de datos: Un cient铆fico de datos generalmente utiliza conocimientos matem谩ticos o estad铆sticos para construir algoritmos, modelos y otras herramientas anal铆ticas para ayudar a organizar e interpretar los datos.
Analista de inteligencia empresarial (business analyst): Los analistas de inteligencia empresarial analizan los datos de la empresa, como la informaci贸n de ventas o las m茅tricas de compromiso de los clientes, para obtener informaci贸n procesable sobre el rendimiento de la empresa.
Analista de operaciones: Los analistas de operaciones recopilan datos sobre cuestiones operativas en empresas u otras organizaciones. Los analistas de operaciones pueden utilizar los datos para encontrar informaci贸n empresarial y soluciones a problemas de producci贸n, personal o cualquier otro aspecto relacionado.
Analista de marketing: Los investigadores o analistas de marketing recogen informaci贸n sobre los clientes actuales o potenciales, las condiciones del mercado o las actividades de la competencia. Los datos recogidos se utilizan para entender c贸mo puede responder una empresa mediante t谩cticas de marketing o ajustes del producto.
Aprender a incorporar big data en tu carrera puede aportarte nuevas perspectivas en tu trabajo, y es probable que los datos sigan creciendo en importancia. Varios cursos en l铆nea, como los siguientes, pueden ayudarte a empezar:
Aprende a desenvolverte en el mundo de big data y a dominar Hadoop con el curso de Big Data de la UC San Diego.
Familiar铆zate con los fundamentos del aprendizaje autom谩tico con un curso de la Universidad de Stanford.
Encuentra c贸mo escalar la ciencia de datos y el aprendizaje autom谩tico para big data utilizando Apache Spark.
Foro Econ贸mico Mundial. ", http://www3.weforum.org/docs/WEF_Future_of_Jobs_2020.pdf". Consultado el 22 de abril de 2022.
Editorial Team
糖心vlog官网观看鈥檚 editorial team is comprised of highly experienced professional editors, writers, and fact...
This content has been made available for informational purposes only. Learners are advised to conduct additional research to ensure that courses and other credentials pursued meet their personal, professional, and financial goals.