Organizaciones requieren estrategia de datos para mejorar experiencia de los usuarios: AWS
Las Vegas, Estados Unidos.- Los datos son la base para impulsar la creatividad moderna, sin embargo, aún existen retos para convertirlos en acciones concretas, tales como datos dispersos o aislados e inconsistentes, que lleva a largos plazos de limpieza. Para resolver estos desafíos, Swami Sivasubramanian, vicepresidente de datos y Machine Learning (ML) en Amazon Web Services (AWS), presentó una serie de innovaciones que buscan resolver algunos de estos desafíos para democratizar el acceso a las capacidades de ML en la Nube.
Durante su presentación en el evento AWS re:Invent 2022, el directivo señaló que algunas organizaciones podrían enfrentar dificultades para el establecimiento de una estrategia que les permita el pleno aprovechamiento de sus datos. “Hemos descubierto al menos tres elementos centrales de una estrategia fuerte de datos: requieren una base de datos a prueba del futuro; segundo, soluciones que lleven el tejido conectivo a toda la organización; y tercero, las herramientas correctas y educación para democratizar los datos”, indicó.
Con base en estos elementos, AWS presentó nuevas características añadidas a sus herramientas de bases de datos, incluyendo nuevas capacidades para Amazon OpenSearch, DocumentDB y Amazon Athena. El directivo destacó que algunas de las grandes marcas como Toyota y Coca-Cola utilizan algunas de estas herramientas en sus propios procesos de innovación.
Amazon OpenSearch Serverless permite a las empresas desplegar servicios de búsqueda o monitoreo de datos mediante una configuración automática y flexible conforme se incrementa o baja la demanda de los servicios. Incluye además capacidades para visualización de datos.
Amazon Athena para Apache Spark. AWS afirma que la integración de ambas plataformas permite el acceso a analíticas interactivas hasta tres veces más rápido respecto a soluciones de código abierto. Al mismo tiempo, ya que Athena está conectado con otros servicios de AWS, se incluye integración de ambas plataformas con RedShift, su solución para el análisis de datos, como una vista previa.
Entérate: AWS fortalece sus soluciones de datos para mejor análisis, seguridad e inteligencia
Típicamente Amazon Athena permite ejecutar consultas de bases de datos en una interfaz de SQL, y Apache Spark se encarga del procesamiento de grandes cargas de datos. Sin embargo, la configuración de Spark demanda tiempo para la configuración de la infraestructura para provisión y escala. AWS espera que este tipo de soluciones permitan a los científicos de datos enfocarse más en la analítica y visualización de la información, en vez de consumir tiempo en preparar las interfaces necesarias para sus proyectos.
DocumentDB, la solución para ejecutar cargas de documentos de hasta 64 tebibytes (1 TiB o tebibyte equivale a 2⁴⁰ bytes), recibió una nueva actualización para permitir a los usuarios escalar la solución por arriba de un único nodo de base de datos, con capacidad para almacenar hasta 2 petabytes. Algunos de los clientes que aprovechan las capacidades de esta herramienta son Liberty Mutual y Venmo.
Expedia también ha aprovechado las capacidades de análisis y procesamiento de datos en la Nube de Amazon para realizar más de 600 mil millones de predicciones cada año con SageMaker, administrar más de 70 petabytes de datos y 360 mil permutaciones en su página.
AWS también presentó algunas mejoras para SageMaker con algoritmos predeterminados para tareas de análisis de datos geoespaciales mediante el uso de Machine Learning. Esta nueva funcionalidad permite acceder a datos de fuentes y prepararla con algoritmos predeterminados, así como preparar visualizaciones en 3D.
Por ejemplo, permitiría identificar el estado de calles y carreteras durante la inundación de una ciudad, para una mejor planeación de los servicios de misión crítica y alertar a las autoridades, además de la identificación de otra infraestructura disponible en el área como hospitales, escuelas, estaciones de bomberos y otros.
Otras mejoras para SageMaker incluyen la capacidad de dar seguimiento a los modelos de ML de una organización, una mejor gobernanza para controlar accesos y permisos, facilitar la recopilación de datos del negocio como requerimientos o decisiones tomadas (Model Cards), y Notebooks, que facilita y acelera la colaboración entre diferentes equipos sobre una misma base de datos.
Relacionado: Nuevo chip y protocolos: AWS promete mejoras al rendimiento de la Nube
Finalmente, para llevar a cabo la democratización de los datos, AWS se ha enfocado en presentar soluciones que permitan a cualquier persona, ya sea que sepa código o no, o tenga o no conocimiento de ciencias de datos, para acceder a las herramientas de análisis y predicción en la Nube, tales como QuickSight Q y SageMaker ML.
Sivasubramanian alertó que tan sólo en Estados Unidos hay una brecha de talento relevante, con apenas 54 mil graduados de carreras como ciencias de la computación, un nivel crítico, ya que se estima que en 2025 habrá una demanda por un millón de posiciones en áreas de Inteligencia Artificial (IA).
Para ello, presentó AWS Machine Learning University, enfocada en proveer contenido y currícula para las universidades comunitarias de Estados Unidos. El directivo señaló que la meta es llegar a 50 universidades.