FFmpeg 6.0 llega con mejoras de soporte en decodificadores y mas

FFmpeg

FFmpeg es una colección de software libre que puede grabar, convertir y hacer streaming de audio y vídeo. Incluye libavcodec, una biblioteca de códecs.

Después de seis meses de desarrollo se dio a conocer el lanzamiento del paquete multimedia FFmpeg 6.0, que incluye un conjunto de aplicaciones y una colección de bibliotecas para operaciones en varios formatos multimedia (grabación, conversión y decodificación de formatos de audio y video).

Para quienes desconocen de FFmpeg deben saber que este es un proyecto de software libre que puede que permite a los usuarios para decodificar, codificar, transcodificar, mux, demux, stream, filtro, streaming de audio y vídeo, entre otras muchas cosas más.

También vale la pena mencionar que el paquete contiene libavcodec, libavutil, libavformat, libavfilter, libavdevice, libswscale y libswresample que puede ser utilizado por las aplicaciones. Así como ffmpeg, ffserver, ffplay y ffprobe, que puede ser utilizado por los usuarios finales para la transcodificación, el streaming y la reproducción.

Principales novedades de FFmpeg 6.0

En esta nueva versión que se presenta de FFmpeg 6.0, la compilación del paquete de ffmpeg en modo multiproceso se ha movido a la categoría de obligatorio, con lo cual cada empaquetador de contenedores de medios (muxer) ahora se ejecuta en un hilo separado.

Tambien podremos encontrar en esta nueva versión, el soporte implementado para VAAPI y QSV (Quick Sync Video) para codificar y decodificar VP9 y HEVC con submuestreo de color 4:2:2 y 4:4:4, codificación de profundidad de color de 10 y 12 bits.

Otra de las novedades que se presenta, es que se agregó soporte para la biblioteca oneVPL (oneAPI Video Processing Library) para usar la tecnología de aceleración de hardware Intel QSV (Quick Sync Video), asi como tambien que se añadió el codificador AV1 acelerado por hardware basado en QSV.

Por la parte de las nuevas opciones agregadas a la utilidad ffmpeg, se destaca la inclusión de -shortest_buf_duration para establecer la duración máxima de los fotogramas almacenados en búfer (cuanto más, mayor precisión en el modo «-shortest», pero mayor consumo de memoria y latencia).

Otra de las opciones añadidas es -stats_enc_pre[_fmt], -stats_enc_post[_fmt] y -stats_mux_pre[_fmt] para escribir información cuadro por cuadro sobre flujos seleccionados en el archivo especificado en diferentes etapas de codificación.

«-fix_sub_duration_heartbeat» para definir la secuencia de video de sincronización (latido) utilizada para dividir los subtítulos.

La sintaxis de filtergraph se ha ampliado con la capacidad de pasar valores de opción del archivo especificado. El nombre del archivo se especifica especificando un valor con el prefijo ‘/’, por ejemplo, «ffmpeg -vf drawtext=/text=/tmp/some_text» cargará el parámetro de texto del archivo /tmp/some_text.

Se agregó soporte para formatos de imagen: WBMP (mapa de bits de protocolo de aplicación inalámbrica), Radiance HDR (RGBE) y se agregaron nuevos decodificadores: APAC, bonk, Micronas SC-4, Media 100i, ViewQuest VQC, MediaCodec (NDKMediaCodec), WADY DPCM, CBD2 DPCM, XMD ADPCM, WavArc, RKA.

De los demás cambios que se destacan:

  • Se agregaron nuevos codificadores: nvenc AV1, MediaCodec.
  • Se agregaron demultiplexores para contenedores de medios: SDNS, APAC, bonk, LAF, WADY DPCM, XMD ADPCM, WavArc, RKA.
  • Nuevos filtros de vídeo:
    ddagrab : captura de video de escritorio de Windows a través de la API de duplicación de escritorio.
    corr – determina la correlación entre dos videos.
    ssim360 – puntuación de similitud para video de 360°.
    hstack_vaapi , vstack_vaapi y xstack_vaapi : fusión de varios videos (cada video se muestra en su propia área de pantalla) usando VAAPI para la aceleración.
    backgroundkey – convierte un fondo estático en uno transparente.
    El filtro cropdetect ahora tiene un modo de detección de cultivos basado en vectores de movimiento y bordes.
  • Nuevos filtros de sonido:
    showcwt: conversiones de audio a video con visualización de frecuencia de espectro utilizando transformada wavelet continua y morlet
    adrc: aplica un filtro al flujo de audio de entrada para cambiar el rango dinámico espectral.
    a3dscope: convierte el audio de entrada en audio espacial 3D.
    afdelaysrc: Genera coeficientes de respuesta de impulso finito
  • Nuevos filtros de flujo de bits :
    Convertir de media100 a mjpegb.
    Convertir de DTS a PTS.

Descargar y obtener FFmpeg 6.0

Finalmente, para quienes quieran realizar la instalación o actualización de FFmpeg 6.0 deben saber que este paquete se encuentra en la mayoría de las distribuciones de Linux o si lo prefieren pueden descargar su código fuente para su compilación desde el siguiente enlace.

Y para realizar la instalación desde el código fuente, basta con ejecutar la secuencia de comandos ya conocidos:

./configure
make
make install

Para el caso de los que son usuarios de Ubuntu, Debian o cualquier otro derivado de estas distribuciones basta con abrir una terminal y en ella ejecutar el siguiente comando:

sudo apt install ffmpeg

Mientras que para el caso de Fedora el comando a ejecutar es el siguiente:

sudo install ffmpeg

Y para el caso de los que son usuarios de Arch Linux, Manjaro o cualquier otro derivado de Arch Linux basta con ejecutar el siguiente comando:

sudo pacman -S ffmpeg


from Desde Linux https://ift.tt/MRoaT3v
via IFTTT

Nokia cambia su icónico logotipo para indicar un nuevo camino

Nokia ya no fabricará teléfonos. La marca finlandesa anunció recientemente planes para renovar su identidad por primera vez en casi seis décadas.

Así lo señaló en una entrevista a Reuters el director ejecutivo de la compañía, Pekka Lundmark:

Existía la asociación con los teléfonos inteligentes, y hoy en día somos una empresa de tecnología comercial.

La actualización comercial de la compañía se anunció en la víspera del Mobile World Congress (MWC), un congreso de carácter anual en torno al mundo de la comunicación móvil, que se celebra en la Fira de Barcelona, España.

Según Lundmark:

En la mente de la mayoría de la gente, todavía somos una marca exitosa de teléfonos móviles, pero esto no es de lo que se trata Nokia. Queremos lanzar una nueva marca que se centre mucho en las redes y la digitalización industrial, que es algo completamente diferente de los teléfonos móviles heredados.

Nokia pretende vender redes privadas 5G a empresas

Es curioso que, aunque Nokia había lanzado al mercado teléfonos inteligentes y de funciones, la compañía dejó de fabricarlos después de que Microsoft adquirió la división de Dispositivos y Servicios por $7 mil millones en 2014. HMD Global, uno de los licenciatarios de la marca Nokia, adquirió los derechos para fabricar teléfonos inteligentes y tabletas bajo la marca Nokia.

Aunque Nokia dejó de comercializar teléfonos hace tiempo, su enorme popularidad todavía la vincula con ellos en la mente del público. Ahora que se considera una «empresa de tecnología empresarial», la compañía quiere cambiar esa percepción.

Nokia
Esto es Nokia, pero no como el mundo le ha visto antes.

Según Lundmark, Nokia aumentará el crecimiento de su negocio vendiendo redes privadas 5G a empresas.

Tuvimos un muy buen crecimiento del 21 por ciento el año pasado en la empresa, que actualmente representa alrededor del ocho por ciento de nuestras ventas, (o) dos mil millones de euros ($ 2,11 mil millones) aproximadamente. Queremos llevar eso a dos dígitos lo más rápido posible.

Además de eso, Nokia explicó en su blog que enfocará sus esfuerzos en aprovechar oportunidades en sectores más allá de los dispositivos móviles para monetizar su propiedad intelectual, seguir invirtiendo en I+D para Nokia Technologies, implementar nuevos modelos de negocio, como el servicio, y convertir ESG en una ventaja competitiva para convertirse en el ‘proveedor preferido de confianza’ de la industria.

Según Reuters, el cambio de enfoque de Nokia podría llevarlos a competir con Microsoft y Amazon. Lundmark agregó:

Habrá diferentes tipos de situaciones, a veces serán nuestros socios… a veces nuestros clientes… y estoy seguro de que también habrá momentos en que serán nuestros competidores.

El cargo Nokia cambia su icónico logotipo para indicar un nuevo camino apareció primero en Tecnovedosos.



source https://tecnovedosos.com/nokia-cambia-logotipo/

gccrs se estará integrando en GCC 13

gccrs

gccrs es una implementación alternativa completa del lenguaje Rust sobre GCC

Se dio a conocer hace poco que el proyecto «gccrs», cuyo objetivo es proporcionar una interfaz para el lenguaje Rust a GCC (GNU Compiler Collection), está en camino de integrarse en GCC 13.  En la conferencia de desarrolladores FOSDEM a principios de este mes, el ingeniero Arthur Cohen hizo una presentación sobre gccrs que describe el estado actual del trabajo.

Para quienes desconocen del proyecto gccrs, deben saber que este es una implementación alternativa completa del lenguaje Rust sobre GCC con el objetivo de convertirse completamente en la cadena de herramientas GNU.

El origen de este proyecto es un esfuerzo de la comunidad hace varios años, cuando Rust aún estaba en la versión 0.9; el lenguaje creado por Mozilla estuvo sujeto a tantos cambios que se hizo difícil que un esfuerzo de la comunidad se pusiera al día.

Ahora que el lenguaje es estable, es hora de crear compiladores alternativos:

“Empezó en 2014 (y se relanzó en 2019), el esfuerzo ha estado en curso desde 2020 y hemos hecho mucho esfuerzo y mucho progreso. Hemos subido la primera versión de gccrs dentro de GCC. Entonces, la próxima vez que instale GCC 13, tendrá gccrs dentro.

Puede usarlo y puede comenzar a piratearlo, puede informar los problemas cuando inevitablemente se bloquee y muera horriblemente. Una gran cosa que estamos haciendo es trabajar para que el conjunto de pruebas de rustc funcione”, dijo Arthur Cohen durante su presentación en la conferencia FOSDEM a principios de este mes.

La capacidad de ejecutar con éxito el conjunto de pruebas del compilador rustc también sigue siendo un objetivo. Según Cohen, la interfaz GCC de Rust también apunta a la versión anterior de Rust libcore 1.49.

Las preguntas frecuentes del proyecto gccrs señalan que todas las tecnologías de compilación de LLVM, que utiliza Rust, «carecen de algunos backends compatibles con GCC, por lo que una implementación de gccrs puede llenar los vacíos para su uso en el desarrollo integrado«.

Sin embargo, tenga en cuenta que el compilador Rust-GCC (gccrs) aún se encuentra en una etapa muy temprana y aún no se puede utilizar para compilar programas reales de Rust.

El equipo de GCC votó en julio pasado para aprobar la integración de gccrs como una suite de compilación. La importancia de este proyecto radica en su importancia para el kernel de Linux. De hecho, el kernel de Linux generalmente se construye con GCC, pero los planes para permitir que el lenguaje Rust se use junto con C para el código del kernel, por razones de seguridad de la memoria, están progresando constantemente.

El proyecto «Rust for Linux» se fusionó oficialmente con el árbol principal de Linux 6.1 Git en octubre pasado, lo que convirtió a Rust en el segundo lenguaje dedicado al desarrollo de Linux, después de 31 años de desarrollo exclusivamente basado en C.

“Queremos que gccrs sea un verdadero compilador de Rust y no un proyecto de juguete o algo que compile un lenguaje que se parece a Rust, pero que no es Rust; realmente estamos tratando de hacer que este conjunto de pruebas funcione”, agregó. Durante la presentación, Cohen también dijo que si bien la interfaz Rust de GCC 13 ha tenido un buen comienzo, todavía queda mucho trabajo por hacer. El código de verificación prestado está notablemente ausente en este momento, el soporte para módulos integrados e intrínsecos aún está en curso, y aún no se ha alcanzado el hito importante de compilar el código de Rust para Linux.

Como recordatorio, el proyecto «Rust for Linux» tiene como objetivo introducir un nuevo lenguaje de programación del sistema en el kernel de Linux. Según los expertos, el lenguaje Rust tiene una propiedad clave que hace que sea muy interesante considerarlo como el segundo lenguaje del kernel de Linux: asegura que no se produzca ningún comportamiento indefinido (siempre que el código inseguro esté cuerdo).

Esto incluye la ausencia de errores como uso after-free, double frees, carreras de datos, etc. Los debates relacionados giran en torno a la posibilidad de desechar C a favor del lenguaje Rust. Pero Linus Torvalds, el creador de Linux, dijo que ese no es el objetivo declarado del proyecto Rust for Linux.

Finalmente, cabe mencionar que aunque la interfaz de gccrs se fusionó para la próxima versión de GCC 13, aún no se encuentra en un estado en el que la mayoría de los desarrolladores de Rust puedan realmente utilizarla como una alternativa al compilador LLVM oficial de Rust.

No debería ser hasta el próximo año, al menos con GCC 14 al menos.

Fuente: https://fosdem.org/



from Desde Linux https://ift.tt/B0oV3gl
via IFTTT

Encontraron más de 15.000 paquetes de phishing y spam en NPM

NPM attack

NPM attack

 

Se dio a conocer hace poco la noticia de que, fue registrado un ataque a usuarios del directorio de NPM, producto del cual, el 20 de febrero, se colocaron más de 15 mil paquetes en el repositorio de NPM, en cuyos archivos README había enlaces a sitios de phishing o enlaces de referencia para los cuales se pagaron regalías.

El análisis de los paquetes reveló 190 enlaces promocionales o de phishing únicos que cubrían 31 dominios.

El lunes 20 de febrero, Checkmarx Labs descubrió una anomalía en el ecosistema NPM cuando cruzamos información nueva con nuestras bases de datos. Se habían publicado grupos de paquetes en grandes cantidades en el administrador de paquetes de NPM. Investigaciones posteriores revelaron que los paquetes formaban parte de un nuevo vector de ataque de tendencia, en el que los atacantes enviaban spam al ecosistema de código abierto con paquetes que contenían enlaces a campañas de phishing. Informamos sobre un ataque similar en diciembre pasado.

En esta situación, parece que se usaron procesos automatizados para crear más de 15 000 paquetes en NPM y cuentas de usuario relacionadas. Las descripciones de estos paquetes contenían enlaces a campañas de phishing. Nuestro equipo alertó al equipo de seguridad de NPM.

Los nombres de los paquetes se eligieron para atraer el interés por ejemplo, «free-tiktok-followers», «free-xbox-codes», «instagram-followers-free», etc.

El cálculo se realizó para completar la lista de actualizaciones recientes en la página principal de NPM con paquetes de spam. Las descripciones de los paquetes incluían enlaces que prometían obsequios, trucos de juegos y servicios gratuitos para obtener seguidores y me gusta en redes sociales como TikTok e Instagram. Este no es el primer ataque de este tipo, en diciembre se publicaron 144 mil paquetes de spam en los directorios NuGet, NPM y PyPi.

El contenido de los paquetes se generó automáticamente mediante un script de python que aparentemente se dejó en los paquetes por error e incluía las credenciales de trabajo utilizadas en el ataque. Los paquetes se han publicado en muchas cuentas diferentes utilizando métodos que dificultan desentrañar el rastro e identificar rápidamente los paquetes problemáticos.

Además de actividades fraudulentas, también se han identificado varios intentos de publicación de paquetes maliciosos en los repositorios de NPM y PyPi:

  • Se ha encontrado en el repositorio de PyPI451 paquetes maliciosos que se hicieron pasar por algunas bibliotecas populares usando typequatting (asignando nombres similares que difieren en caracteres individuales, por ejemplo, vper en lugar de vyper, bitcoinnlib en lugar de bitcoinlib, ccryptofeed en lugar de cryptofeed, ccxtt en lugar de ccxt, cryptocommpare en lugar de cryptocompare, seleium en lugar de selenium, pinstaller en lugar de pyinstaller, etc.).
  • Los paquetes incluían un código ofuscado para robar criptomonedas, que determinaba la presencia de identificadores de billetera criptográfica en el portapapeles y los cambiaba a la billetera del atacante (se supone que al realizar un pago, la víctima no notará que el número de billetera se transfirió a través del portapapeles) es diferente).
  • La sustitución se llevó a cabo mediante un complemento integrado en el navegador, que se realizó en el contexto de cada página web visitada.
  • Se han identificado una serie de bibliotecas HTTP maliciosas en el repositorio de PyPI.
  • Se encontró actividad maliciosa en 41 paquetes cuyos nombres se seleccionaron mediante métodos de tipoquatting y se parecían a bibliotecas populares (aio5, requestst, ulrlib, urllb, libhttps, piphttps, httpxv2, etc.).
  • El relleno se diseñó para que pareciera bibliotecas HTTP en funcionamiento o código copiado de bibliotecas existentes, y la descripción afirmaba beneficios y comparaciones con bibliotecas HTTP legítimas. La actividad maliciosa se limitó a descargar malware en el sistema o recopilar y enviar datos confidenciales.
  • NPM identificó 16 paquetes de JavaScript (speedte*, trova*, lagra), que, además de la funcionalidad declarada (prueba de rendimiento), también contenían código para la minería de criptomonedas sin el conocimiento del usuario.
  • NPM identificó 691 paquetes maliciosos. La mayoría de los paquetes problemáticos pretendían ser proyectos de Yandex (yandex-logger-sentry, yandex-logger-qloud, yandex-sendsms, etc.) e incluían código para enviar información confidencial a servidores externos. Se supone que quienes colocaron los paquetes intentaron lograr la sustitución de su propia dependencia al construir proyectos en Yandex (método de sustitución de dependencias internas).

En el repositorio de PyPI, los mismos investigadores encontraron 49 paquetes (reqsystem, httpxfaster, aio6, gorilla2, httpsos, pohttp, etc.) con código malicioso ofuscado que descarga y ejecuta un archivo ejecutable desde un servidor externo.

Finalmente si estás interesado en poder conocer más al respecto, puedes consultar los detalles en el siguiente enlace.



from Desde Linux https://ift.tt/HoVZp1C
via IFTTT

Febrero 2023: Lo bueno, malo e interesante del Software Libre

Febrero 2023: Lo bueno, malo e interesante del Software Libre

Febrero 2023: Lo bueno, malo e interesante del Software Libre

Hoy, penúltimo día de «febrero 2023», como de costumbre, al final de cada mes, les traemos este pequeño compendio, con algunas de las más destacadas publicaciones de dicho periodo.

Para que disfruten y compartan más fácilmente algunas de las mejores y más relevantes informaciones, noticias, tutoriales, manuales, guías y lanzamientos, de nuestra web. Y de otras fuentes confiables, como la web DistroWatch, la Fundación para el Software Libre (FSF), la Iniciativa de Código Abierto (OSI) y la Fundación Linux (LF).

Introducción del Mes

De manera tal, de que puedan más fácilmente mantenerse al día en el ámbito del Software Libre, Código Abierto y GNU/Linux, y otros ámbitos relacionados con la actualidad tecnológica.

Publicaciones del Mes

Resumen de febrero 2023

Dentro de DesdeLinux en febrero 2023

Buenas

Malas

Interesantes

Top 10: Publicaciones recomendadas

  1. Febrero 2023: Acontecer informativo del mes sobre GNU/Linux: Resumen noticioso sobre GNU/Linux, el Software Libre y el Código Abierto del mes en curso que empieza. (Ver)
  2. Wireless Attack Hacking Tools: Wifite y WEF: 2 herramientas similares FSociety, que también ofrecen facilitar la gestión y automatización de diversas Hacking Tools. (Ver)
  3. OpenAI lanza ChatGPT Plus, con un plan de suscripción de $20 al mes: Con el fin de obtener un mejor acceso a ChatGPT y lograr usar todo su potencial disponible. (Ver)
  4. Go 1.20 llega con el soporte experimental de PGO, mejoras y más: Fruto de una fase de desarrollo extendida, ahora incluye soporte a la optimización guiada por perfiles (PGO). (Ver)
  5. Linux Audit Framework: Todo sobre el comando Auditd: Una utilidad de software de auditoría para Linux, la cual, proporciona un sistema de auditoría compatible con CAPP. (Ver)
  6. Lynis: Software de auditoría de seguridad en Linux, macOS y UNIX: Una herramienta de seguridad para sistemas que ejecutan SO basados en Linux, macOS o Unix. (Ver)
  7. Endless OS 5.0 llega con 5.15, GNOME 41 y más: Muchos novedades incluidas para esta Distro GNU/Linux que impulsa la innovación entre los sistemas GNU/Linux de consumo. (Ver)
  8. ChatBot Bard de Google: El próximo gran competidor de ChatGPT: ChatBot Bard, es un sistema de IA conversacional que tiene el potencial de rivalizar con ChatGPT. (Ver)
  9. OpenSSL 3.0.8 llega corrigiendo varios errores de seguridad: Errores entre los que se incluyen la peligrosa vulnerabilidad (CVE-2023-0286), y otras como CVE-2022-4304(Ver)
  10. Translaite: Un interesante sitio web gratuito para probar ChatGPT: El cual, permite disfrutar de muchas características y bondades de ChatGPT sin subscribirse. (Ver)

Fuera de DesdeLinux

Fuera de DesdeLinux en febrero 2023

Lanzamientos de Distros GNU/Linux según DistroWatch

  1. Gnoppix Linux 23.2: 01/02/2023.
  2. Slax 15.0.1 y 11.6.0: 02/02/2023.
  3. SparkyLinux 6.6: 06/02/2023.
  4. Endless OS 5.0.0: 08/01/2023.
  5. Deepin 23 Alpha 2: 08/01/2023.
  6. Univention Corporate Server 5.0-3: 09/02/2023.
  7. KaOS 2023.02: 14/02/2023.
  8. Parrot 5.2: 15/02/2023.
  9. Clonezilla Live 3.0.3-22: 16/02/2023.
  10. Athena OS 2023.02.20: 20/02/2023.
  11. Neptune 7.9 Beta 1: 21/02/2023.
  12. OpenSUSE 15.5 Beta: 22/02/2023.
  13. TrueNAS 22.12.1 «SCALE»: 22/02/2023.
  14. GParted Live 1.5.0-1: 23/02/2023.
  15. Ubuntu 22.04.2: 24/02/2023.
  16. Redcore Linux 2301: 24/02/2023.
  17. TUXEDO OS 2: 24/02/2023.

Para profundizar más información sobre cada uno de estos lanzamientos y otros más, haga clic en el siguiente enlace.

Últimas Noticias de la Fundación para el Software Libre (FSF / FSFE)

  • Fundación de Software Libre Europa – ¡Gracias por ayudarnos a alcanzar nuestro objetivo!: Gracias a vuestras valiosas aportaciones hemos alcanzado nuestro objetivo de recaudación de fondos. Gracias por vuestra confianza y apoyo, incluso en estos tiempos difíciles. Estos fondos nos ayudarán a impulsar nuestras campañas y a organizar eventos y charlas para difundir nuestro trabajo, al tiempo que seguimos promoviendo la libertad del software. (Ver)

Para profundizar más, sobre esta información y otras noticias del mismo periodo, haga clic en los siguientes enlaces: FSF y FSFE.

Últimas Noticias de la Iniciativa de Código Abierto (OSI)

  • Predicciones en código abierto: Seguridad, Estrategias maduras, COSO, AI/ML: Entre las que se incluyen están las siguientes, una mayor demanda de habilidades de código abierto, un mayor impacto sobre la economía y el mercado laboral, una mayor conciencia sobre la seguridad de código abierto, una mayor adopción generalizada de contenedores y la tecnología Kubernetes, una mayor conciencia y aplicación de la tecnología IA ética, entre otras. (Ver)

Para profundizar más, sobre esta información y otras noticias del mismo periodo, haga clic en el siguiente enlace.

Últimas Noticias de la Organización Fundación Linux (FL)

  • Linux Foundation Europe anuncia la constitución de la OpenWallet Foundation: La Fundación Linux Europa, proveedor independiente de confianza y hogar neutro para proyectos de código abierto en Europa, ha anunciado hoy la constitución oficial de OpenWallet Foundation (OWF). Este nuevo esfuerzo colaborativo desarrollará software de código abierto para respaldar la interoperabilidad de una amplia gama de casos de uso de monederos, incluyendo la realización de pagos, la prueba de identidad, el almacenamiento de credenciales validadas para puestos de trabajo, educación, posición financiera y derechos a fin de favorecer la confianza en el futuro digital. (Ver)

Para profundizar más, sobre esta información y otras noticias del mismo periodo, haga clic en los siguientes enlaces: Fundación Linux, en inglés; y la Fundación Linux Europa, en español.

Resumen: Publicaciones varias

Resumen

En resumen, esperamos que este pequeño y útil compendio de noticias” con lo más destacado dentro y fuera del Blog «DesdeLinux» para este segundo mes del año, «febrero 2023», sea un gran aporte al mejoramiento, crecimiento y difusión de las «tecnologías libres y abiertas».

Si te ha gustado esta publicación, no dejes de comentarla y de compartirla con otros. Y recuerda, visitar nuestra «página de inicio» para explorar más noticias, además de unirte a nuestro canal oficial de Telegram de DesdeLinux, o este grupo para más información sobre el tema de hoy.



from Desde Linux https://ift.tt/PHxNsv9
via IFTTT

FlexGen, un motor para ejecutar bots de IA en una sola GPU

FlexGen

FlexGen es un motor creado con el propósito de reducir los requisitos de recursos de inferencia de modelos de lenguaje grandes a una sola GPU

Se dio a conocer hace poco la noticia de que un grupo de investigadores de la Universidad de Stanford, la Universidad de California en Berkeley, ETH Zurich, la Escuela Superior de Economía, la Universidad Carnegie Mellon, así como Yandex y Meta, han publicado el código fuente de un motor para ejecutar grandes modelos de lenguaje en sistemas con recursos limitados.

Con nombre clave «FlexGen», es un proyecto que tiene como objetivo reducir significativamente los requisitos de recursos para las operaciones de inferencia LLM. Publicado en GitHub , FlexGen solo requiere Python y PyTorch pero sobre todo se puede usar con una sola GPU como NVIDIA Tesla T4 o GeForce RTX 3090.

Por ejemplo, el motor brinda la capacidad de crear una funcionalidad que recuerda a ChatGPT y Copilot al ejecutar un modelo OPT-175B preentrenado que cubre 175 mil millones de parámetros en una computadora normal con una tarjeta gráfica para juegos NVIDIA RTX3090 equipada con 24 GB de memoria de video.

Se menciona que los modelos de (LLM) respaldan el funcionamiento de herramientas como ChatGPT y Copilot. Estos son modelos extensos que usan miles de millones de parámetros y están entrenados en grandes cantidades de datos.

Los altos requisitos computacionales y de memoria para las tareas de inferencia de LLM generalmente requieren el uso de aceleradores de alta gama.

Estamos contentos de que el público esté realmente entusiasmado con FlexGen. Sin embargo, nuestro trabajo aún está en preparación y aún no está listo para su lanzamiento/anuncio público. Gracias a los primeros comentarios sobre este proyecto, nos dimos cuenta de que las primeras versiones de este LÉAME y nuestro documento no tenían claro el propósito de FlexGen. Este es un esfuerzo preliminar para reducir los requisitos de recursos de los LLM, pero también tiene muchas limitaciones y no pretende reemplazar los casos de uso cuando hay suficientes recursos disponibles.

La inferencia LLM es un proceso en el que se utiliza un modelo de lenguaje para generar predicciones sobre el texto de entrada: implica el uso de un modelo de lenguaje, como un modelo generativo como un GPT ( Transformador preentrenado generativo ), para hacer predicciones sobre lo que es más probable que ocurra. proporcionarse como respuesta después de un texto capturado de entrada específico.

Sobre FlexGen

El paquete incluye un script de ejemplo para crear bots que le permite al usuario descargar uno de los modelos de lenguaje disponibles públicamente y comenzar a chatear de inmediato.

Como base, se propone utilizar un gran modelo de lenguaje publicado por Facebook, entrenado en las colecciones BookCorpus (10 mil libros), CC-Stories, Pile (OpenSubtitles, Wikipedia, DM Mathematics, HackerNews, etc.), Pushshift.io (basado en datos de Reddit)) y CCNewsV2 (archivo de noticias).

El modelo cubre alrededor de 180 mil millones de tokens (800 GB de datos). Se necesitaron 33 días de funcionamiento del clúster con 992 GPU NVIDIA A100 de 80 GB para entrenar el modelo.

Al ejecutar OPT-175B en un sistema con una sola GPU NVIDIA T4 (16 GB), el motor FlexGen demostró un rendimiento hasta 100 veces más rápido que las soluciones ofrecidas anteriormente, lo que hace que el uso de modelos de lenguaje grande sea más asequible y les permite ejecutarse en sistemas sin aceleradores especializados.

Al mismo tiempo, FlexGen puede escalar para paralelizar los cálculos en presencia de varias GPU. Para reducir el tamaño del modelo, se utilizan un esquema de compresión de parámetros adicional y un mecanismo de almacenamiento en caché del modelo.

Actualmente, FlexGen solo admite modelos de lenguaje OPT, pero en el futuro, los desarrolladores también prometen agregar soporte para BLOOM (176 mil millones de parámetros, admite 46 idiomas y 13 lenguajes de programación), CodeGen (puede generar código en 22 lenguajes de programación) y GLM.

Finalmente cabe mencionar que el código está escrito en Python, utiliza el marco PyTorch y se distribuye bajo la licencia Apache 2.0.

Para los interesados en poder conocer más al respecto, pueden consultar los detalles en el siguiente enlace.



from Desde Linux https://ift.tt/tG5ysKC
via IFTTT

PanCSF, un nuevo controlador Linux para GPU Mali de la mano de Collabora

PanCSF

PanCSF: un nuevo controlador DRM para GPU basadas en Mali CSF

Hace pocos días Collabora presentó el lanzamiento del controlador PanCSF DRM (Direct Rendering Manager), que funciona a nivel del kernel de Linux.

El controlador PanCSF DRM está diseñado para usarse con la GPU Mali (G710+) de décima generación, que utiliza la tecnología CSF (Command Stream Frontend), que trae algunas funciones del controlador al lado del firmware para reducir la carga en la CPU y ofrece un nuevo modelo para organizar el trabajo en la GPU.

Como el destino lo tendría, a principios de este mes se presentó un nuevo controlador DRM para las GPU Mali recientes . Esto es un poco extraño en el mundo del subsistema DRM, donde la compatibilidad con el nuevo hardware generalmente se agrega a los controladores de GPU que admiten generaciones de hardware anteriores.

Sobre el controlador PanCSF DRM

Inicialmente, se intentó implementar la compatibilidad con GPU Mali basadas en CSF en el controlador Panfrost, pero los desarrolladores llegaron a la conclusión de que esto conduciría a una gran complicación del controlador existente y sería más óptimo para CSF crear un nuevo controlador creado con una arquitectura diferente.

El nuevo controlador PanCSF propuesto para la prueba implementa una uAPI completamente nueva, una nueva lógica de programación de trabajo y una nueva lógica de control de MMU/GPU-VA. El código Panfrost existente se utiliza como base para el nuevo controlador.

Y es que en la nueva generación de GPU Mali, el programador de Job Manager se reemplazó con una interfaz CSF (Command Stream Frontend), que utiliza un modelo basado en flujo de comandos con programación de cola de flujo de comandos en el lado del firmware en lugar de un modelo basado en cadena de trabajo.

No daremos una descripción detallada de cómo funciona CSF, pero vale la pena señalar que la interfaz de CSF tiene un conjunto de instrucciones dedicado y un montón de registros para pasar datos o mantener estados internos. Hay instrucciones para enviar trabajos (trabajos de cómputo, mosaico y fragmentación) y otras para hacer cosas más triviales, como leer/escribir memoria, esperar a que se complete el trabajo, esperar a las vallas, saltar/ramificarse…

Se menciona que para organizar el trabajo del programador, se integra un microcontrolador Cortex-M7 separado en la GPU y se proporciona una unidad de ejecución de comandos especial para ejecutar las instrucciones CSF. Tales características requieren una organización fundamentalmente diferente de la transferencia de trabajo a la GPU desde el espacio del usuario.

El controlador PanCSF toma prestadas las plantillas típicas de inicialización del controlador, administración de frecuencia y administración de energía, que probablemente se modifiquen a medida que algunas de las funciones de administración de energía en las nuevas GPU Mali se trasladan al firmware.

Si CSF se tratara simplemente de alejarse de un enfoque de envío de trabajos basado en descriptores, podríamos salirnos con una cantidad mínima de cambios en el kernel y aplastar el soporte de CSF para el controlador de kernel existente.

Cabe mencionar que para aquellos que no están familiarizados con las API de gráficos, vale la pena recordar que Vulkan trata de devolver el control al usuario al hacer que gran parte de la administración de la canalización de gráficos sea explícita, mientras que OpenGL intentaba ocultar cosas a sus usuarios para facilitarles la vida.

Finalmente, se menciona que a futuro los desarrolladores tienen en cuenta que este RFC, si bien es al menos parcialmente funcional (hasta ahora solo se probó en la carga de trabajo básica de GLES2), está lejos de estar listo y mencionan que hay cosas que deben de abordar: como tratar de usar drm_sched en lugar de implementar un programador basado en tiempo compartido, tener un mecanismo de desalojo de objetos de búfer adecuado para manejar con gracia situaciones en las que el sistema tiene presión de memoria.

Ademas, se menciona que de momento se carece de soporte para administración de energía, escalado de frecuencia de dispositivos y probablemente otras características útiles como contadores de rendimiento, pero deberían ser relativamente fáciles de implementar en comparación con la programación y la lógica de administración de memoria.

Por último y no menos importante, está previsto que pronto se publiquen los cambios para usar el nuevo controlador en Mesa.

Si estás interesado en poder conocer más al respecto, puedes consultar los detalles en el siguiente enlace.



from Desde Linux https://ift.tt/LAYpMvj
via IFTTT

Lapdock un kit para convertir el Librem 5 en una laptop

Lapdock

Un lapdock es una estación de acoplamiento (o «dock») combinada con una carcasa de computadora portátil.

Purism, que desarrolla el teléfono inteligente Librem 5 y una serie de computadoras portátiles, servidores y mini PC que vienen con Linux y CoreBoot, presentó el kit Lapdock.

Lapdock se posiciona como un kit que permite al usuario el poder usar su teléfono inteligente Librem 5 como una computadora portátil completa.

Cuando solo se usa el Librem 5 en su factor de forma móvil, es fácil pasar por alto que esto está sucediendo, ya que las aplicaciones adaptablesmorph para adaptarse a la pantalla más pequeña. Si proviene de un entorno Android o iOS, es posible que solo note que las aplicaciones tienen nombres extraños y son diferentes de lo que está acostumbrado.

Incluso si proviene de Linux y reconoce estas aplicaciones, puede pasar por alto el poder de la convergencia, porque hay otras plataformas móviles, incluido FDroid en dispositivos Android, que han trasladado aplicaciones de escritorio populares de Linux a versiones solo para dispositivos móviles. Solo cuando acoplas el Librem 5 realmente experimentas el poder de la convergencia.

Sobre Lapdock

Lapdock presenta un marco para computadora portátil con teclado y una pantalla giratoria de 360 ​​grados de 13.3 pulgadas, que además permite usar el dispositivo como una tableta. El uso de un teléfono inteligente como núcleo de una computadora portátil hace posible que siempre lleve consigo datos y aplicaciones.

La plataforma Nexdock 360 ya lanzada se utiliza como base para Lapdock, que se complementa con un soporte para conectar un teléfono inteligente a una estación de acoplamiento y un cable.

Especificaciones de Lapdock

La estación de acoplamiento pesa 1,1 kg y contiene una pantalla IPS de 13,3 pulgadas (1920 × 1080), teclado de tamaño completo, trackpad multitáctil, batería (5800 mAh), Mini HDMI, USB-C 3.1 con DisplayPort, USB-C 3.0, USB -C PD para carga, lector de tarjetas Micro SDXC, jack de audio de 3,5 mm, altavoces.

El tamaño del dispositivo es de 30,7 x 20,9 x 1,5 cm Además de Librem 5, los teléfonos inteligentes basados ​​en la plataforma Android también se pueden usar con la estación de acoplamiento.

  • El Librem 5 funciona con él desde el primer momento, y la pantalla táctil también funciona una vez que está habilitada en nuestra aplicación Configuración móvil (phosh-mobile-tweaks)
  • La pantalla de alta calidad, brillante y nítida y coincide bien con la calidad de la pantalla del Librem 5.
  • El puerto USB-C que se conecta al Librem 5 proporciona suficiente energía para mantener la carga en el Librem 5 mientras está acoplado
  • Los puertos adicionales USB-C y micro SDXC facilitan la conexión de almacenamiento extraíble
  • La función «360» le permite usar el Librem 5 en «modo tableta»
  • La apariencia general es similar a la Librem 5 y la Librem 14

Además Lapdock Kit incluye dos accesorios adicionales que he encontrado esenciales:

  • Una montura magnética
  • Un cable USB-C más corto

Para quienes desconocen del teléfono inteligente Librem 5, deben saber que este está equipado con casi solo software libre, incluidos los controladores y el firmware, brinda al usuario control total sobre el dispositivo y está equipado con interruptores de hardware que le permiten desactivar la cámara, el micrófono, el GPS, Wi-Fi / Bluetooth y el Módulo de banda base en el nivel de interrupción del circuito.

El Lapdock Kit también le permite ejecutar miles de otras aplicaciones de escritorio que aún no se han actualizado para adaptarse a la pantalla de un teléfono. Las aplicaciones tradicionales de Linux como la suite completa de LibreOffice, GIMP, Wireshark, Gqrx y muchas otras funcionan bien en Librem 5 con la adición del espacio de pantalla adicional del Lapdock Kit. Con el kit Lapdock y un Librem 5, es posible que ya no sienta la necesidad de llevar una computadora portátil en los viajes.

El dispositivo viene con una distribución PureOS Linux completamente libre que utiliza la base del paquete Debian y ofrece un entorno de usuario adaptable basado en GNOME para dispositivos móviles y de escritorio (la interfaz de la aplicación cambia dinámicamente según el tamaño de la pantalla y los dispositivos de entrada disponibles).

El entorno le permite trabajar con las mismas aplicaciones GNOME tanto en la pantalla táctil de un teléfono inteligente como en pantallas grandes en combinación con un teclado y un mouse.

Finalmente, para los interesados en Lapdock deben saber que este tiene un costo de $339, (el Nexdock 360 cuesta $299). Puedes consultar más al respecto sobre este dispositivo asi como tambien el poder adquirirlo desde el siguiente enlace.

 



from Desde Linux https://ift.tt/XCpf5W9
via IFTTT

Chrome OS 110 ya fue liberado y estas son sus novedades

Portátil con chrome OS

ChromeOS​ es un sistema operativo basado en Linux diseñado por Google

Hace pocos días se dio a conocer el lanzamiento de la nueva versión de Chrome OS 110 y en esta nueva versión podremos encontrar que se ha rediseñado el mecanismo de autocompletado de entrada al buscar en la interfaz del lanzador (Launcher).

Otra de las novedades que presenta, es el manejo mejorado de errores tipográficos y errores al ingresar frases de búsqueda, asi como tambien que sé proporcionó una división más clara de los resultados en categorías y se propone una navegación más intuitiva por los resultados mediante el teclado.

Ademas de ello, para mejorar la calidad del habla cuando se usan auriculares Bluetooth con ancho de banda limitado, se usa un modelo de habla basado en un sistema de aprendizaje automático para restaurar la parte de alta frecuencia de la señal que se pierde durante la alta compresión. La función se puede utilizar en cualquier aplicación que reciba audio de un micrófono y es especialmente útil cuando se participa en videoconferencias.

Tambien podremos encontrar en esta nueva versión de ChromeOS 110 que se agregaron nuevas herramientas para depurar y diagnosticar problemas con la impresión y el escaneo de documentos.

Implementación mejorada de lectura de texto en voz alta en un bloque seleccionado (seleccionar para hablar), ademas de que se proporciona la capacidad de comenzar a leer en voz alta a través del menú contextual, que se muestra cuando hace clic con el botón derecho en un fragmento de texto seleccionado.

Se proporciona un cambio automático del idioma del hablante según el idioma del texto seleccionado por el usuario. La configuración de seleccionar para hablar se ha movido a la página del configurador estándar, en lugar de abrirse en una pestaña separada del navegador.

Se actualizó la utilidad para enviar notificaciones sobre problemas al trabajar con el sistema, así como deseos y sugerencias. A medida que se escriben los mensajes, la utilidad ahora muestra páginas de ayuda relevantes que podrían ser útiles para abordar el problema usted mismo.

De los demás cambios que se destacan:

  • Crosh presenta el comando printscan_debug para proporcionar informes más detallados sobre la actividad de la impresora y el escáner sin poner el dispositivo en modo de depuración.
  • Al usar versiones de prueba, la rama actual de ChromeOS (Beta, Dev o Canary) se muestra en la esquina inferior derecha junto al indicador de batería.
  • La aplicación de solución de problemas ofrece una prueba de entrada de teclado para asegurarse de que todas las pulsaciones de teclas funcionen correctamente.
  • Se agregó la capacidad de ver archivos PPD (Descripción de impresora PostScript) para las impresoras instaladas (Configuración > Avanzado > Imprimir y escanear > Impresoras > Editar impresora > Ver impresora PPD).
  • Se eliminó la compatibilidad con el sistema de administración de Active Directory, que permitía conectarse a dispositivos basados ​​en ChromeOS con una cuenta de Active Directory.
  • Se anima a los usuarios de esta funcionalidad a migrar de Active Directory Management a Cloud Management.
  • El sistema de control parental brinda la capacidad de confirmar el acceso a sitios bloqueados desde el sistema local del niño sin usar la aplicación Family Link (por ejemplo, cuando un niño necesita acceder a un sitio bloqueado, puede enviar una solicitud de inmediato a los padres).
  • En la aplicación de la cámara, se agregó una advertencia de que no hay suficiente espacio libre en el disco y se detuvo de manera proactiva la grabación de video antes de que el espacio libre se agote por completo.

Finalmente, cabe mencionar la publicación de un conjunto de herramientas para desvincular los dispositivos Chromebook a un sistema de administración centralizado.

Con la ayuda del conjunto de herramientas propuesto, por ejemplo, es posible instalar aplicaciones arbitrarias y eludir las restricciones instaladas en las computadoras portátiles corporativas o en los dispositivos de las instituciones educativas, en las que el usuario no puede cambiar la configuración y está limitado a una lista de aplicaciones rígidamente definida.

Para eliminar el enlace, se utiliza el exploit sh1mmer, que permite ejecutar el código a través de manipulaciones con el modo de recuperación y omitir la verificación mediante firma digital. El ataque se reduce a la descarga de «correcciones de compatibilidad RMA» disponibles públicamente, imágenes de disco con componentes para reinstalar el sistema operativo, recuperarse de un bloqueo y diagnosticar problemas.

El shim RMA está firmado digitalmente, pero el firmware solo verifica la firma de las particiones KERNEL en la imagen, lo que le permite realizar cambios en otras particiones eliminando el indicador de solo lectura de ellas.

El exploit realiza cambios en el shim RMA sin alterar su proceso de verificación, después de lo cual sigue siendo posible ejecutar la imagen modificada usando Chrome Recovery. El shim RMA modificado le permite deshabilitar la vinculación del dispositivo al sistema de control centralizado, habilitar el arranque desde una unidad USB, obtener acceso de root al sistema e ingresar al modo de línea de comandos.

Si quieres conocer más al respecto sobre esta nueva versión del sistema, puedes consultar los detalles dirigiéndote al siguiente enlace.

Descarga

La nueva build ya está disponible para la mayoría de las Chromebooks actuales, además de que desarrolladores externos han formado versiones para computadoras comunes con procesadores x86, x86_64 y ARM.

Por último y no menos importante, si eres usuario de Raspberry debes saber que también puedes instalar Chrome OS en tu dispositivo, solo que la versión que puedas encontrar no es la más actual además de que aún se tiene el problema con la aceleración de video por hardware.



from Desde Linux https://ift.tt/IZxrRin
via IFTTT

Jami «Vilagfa» llega con mejoras para las conversaciones en grupos y mas

Jami

«Jami» es un SIP-compatible con la distribución peer-to-peer y SIP basado en mensajero instantáneo

Se dio a conocer el lanzamiento de la nueva versión de la plataforma de comunicación descentralizada Jami, distribuida bajo el nombre en clave «Világfa», llega con innumerables correcciones de errores y mejoras de las funciones existentes, pero la innovación más importante de esta versión es el Swarm para grupos pequeños.

Para quienes desconocen del proyecto, deben saber que Jami tiene como objetivo la creación de un sistema de comunicaciones P2P que permita tanto la comunicación de grandes grupos como la realización de llamadas individuales con un alto nivel de confidencialidad y seguridad. Jami, anteriormente conocido como Ring y SFLphone, forma parte de los proyectos GNU.

A diferencia de los clientes de comunicación tradicionales, Jami es capaz de transmitir mensajes sin recurrir a servidores externos a través de la organización de una conexión directa entre usuarios que utilizan cifrado de extremo a extremo (extremo a extremo, las claves están presentes solo en el lado del cliente) y autenticación basada en certificados X.509.

Principales novedades de Jami «Vilagfa»

En esta nueva versión que se presenta, tal y como mencionamos al inicio, la novedad principal es que se continuó con el desarrollo del sistema de comunicaciones de grupos de enjambre (Swarms).

Lo interesante de que Swarms, es que permite la creación de chats P2P totalmente distribuidos, cuyo historial de comunicaciones se almacena de forma conjunta en todos los dispositivos de los usuarios de forma sincronizada. Si bien anteriormente solo se permitían dos miembros en el enjambre, la nueva versión de Swarms ahora permite chats en grupos pequeños de hasta 8 personas (hay planes para aumentar la cantidad permitida de miembros en futuras versiones y agregar soporte para chats públicos).

Otro de los cambios que se destaca de la nueva versión, es que sé ha agregado un nuevo botón para crear chats grupales y se ha proporcionado la capacidad de configurar opciones de chat. Después de crear un chat grupal, puede agregarle nuevos miembros y eliminar los existentes.

Hay tres categorías de participantes: invitados (agregados al grupo, pero aún no conectados al chat), conectados y administradores.

Cada miembro puede enviar invitaciones a otras personas, pero solo el administrador puede eliminar del grupo (por ahora solo puede haber un administrador, pero en futuras versiones habrá un sistema flexible de derechos de acceso y la posibilidad de nombrar varios administradores).

Ademas de ello, tambien se destaca en esta nueva versión de Jami «Vilagfa» que se agregó un nuevo panel con información sobre el chat, como la lista de participantes, la lista de documentos enviados y la configuración.

Por otra parte, las conversaciones uno a uno ya tienen muchas funciones y algunas de ellas se actualizaron para que funcionen en conversaciones con varios miembros, ademas de que si se transmite un archivo en una conversación. Cualquier miembro que tenga el archivo puede enviarlo. Esto permite que los participantes reciban archivos incluso si el remitente original no está en línea.

De los demás cambios que se destacan de la nueva versión de Jami «Vilagfa»:

  • Se agregaron varios tipos de indicadores sobre la lectura de un mensaje y la escritura.
  • Se agregó una interfaz para buscar mensajes en los chats.
  • Se agregó soporte para configurar reacciones usando caracteres emoji.
  • Se agregó una opción para mostrar información sobre la ubicación actual.
  • Se ha agregado soporte experimental para un chat grupal que acompaña a una videoconferencia al cliente de escritorio.
  • Se planea a futuro admitir varios administradores y varios niveles de permisos.

Finalmente cabe mencionar que Jami, anteriormente conocido como Ring and SFLphone, es un proyecto GNU y tiene la licencia GPLv3 y si estás interesado en conocer más al respecto, puedes consultar los detalles en el siguiente enlace.

Para los interesados en poder obtener la nueva versión, debe saber que los binarios están preparados para diferentes sistemas, tales como Debian, Ubuntu, Fedora, SUSE, RHEL, Windows, macOS, iOS, Android y Android TV y se están desarrollando varias opciones para interfaces basadas en Qt, GTK y Electron.



from Desde Linux https://ift.tt/2pxcFZS
via IFTTT

Preparados para el futuro: Militares ensayan señales mentales con IA para controlar roboperros de combate

El ejército australiano está llevando a cabo pruebas de una innovadora interfaz cerebral robótica de inteligencia artificial para controlar perros-robot o “roboperros” sincronizados con las mentes de los soldados. Según un vídeo publicado por el ejército australiano recientemente, este avance en inteligencia artificial permite a los soldados controlar los “roboperros” utilizando una forma avanzada de «telepatía» digital.

Así lo señalan los militares en la descripción del vídeo:

#AusArmy está explorando el uso de señales cerebrales para controlar sistemas robóticos y autónomos.

La Oficina de Implementación y Coordinación de Sistemas Robóticos y Autónomos (#RICO) está integrada en nuestra rama de Guerra Futura Terrestre y trabaja en estrecha colaboración con la industria y las partes interesadas.

La IA analiza los datos de las ondas cerebrales y los transmite desde el córtex visual de una persona hasta el “roboperro” de última generación utilizando un casco biosensor de alta tecnología.

Según señaló el sargento Damian Robinson del 5.° Batallón de Apoyo al Servicio de Combate, quien probó los auriculares HoloLens:

Todo el proceso no es difícil de dominar. Es muy intuitivo. Solo tomó un par de sesiones, es más una cuestión de concentración visual. No tienes que pensar en nada específico para operar el robot, pero necesitas concentrarte en ese parpadeo

Durante el curso de capacitación con auriculares para leer la mente y perros robot, Robinson y sus compañeros soldados pudieron sortear terrenos desafiantes y clima inclemente en un campo de batalla falso.

Los faros parpadeantes, percibidos como realidad aumentada en los auriculares, actúan como marcadores hacia los cuales los robots de apariencia canina marchan. Estos son actualmente la clave para mantener los bots en curso.

¿Cómo funciona el “roboperro”?

El equipo que prueba la nueva interfaz cerebro-robot dio comandos «telepáticamente» a un Vision 60 Ghost Robot.

La tecnología es un sistema híbrido creado con un auricular HoloLens 2 fácilmente disponible y un decodificador de inteligencia artificial basado en Raspberry Pi dedicado.

El decodificador de IA especialmente creado y programado intercepta las ondas cerebrales y las convierte en directivas útiles que luego se transmiten «telepáticamente» al perro robot autónomo.

Como explicó el sargento Robinson:

El potencial del proyecto es muy amplio. En esencia, está traduciendo las ondas cerebrales en ceros y unos, y eso se puede implementar en varios sistemas diferentes.

Estas señales cerebrales hicieron que el Ghost Robot se moviera a través de un campo abierto en dirección a una serie de ubicaciones que el controlador humano «seleccionó» imaginándolas.

El robot canino y los soldados humanos cooperaron para despejar varios edificios y, una vez más, los robots caninos y sus compañeros humanos tuvieron éxito.

Los investigadores ejecutaron un segundo conjunto de tareas después de una serie de pruebas exitosas en las que el perro robot comprendió completamente y llevó a cabo las instrucciones.

Investigadores de la Universidad de Tecnología de Sídney, el Centro de Innovación de Defensa y el Grupo de Ciencia y Tecnología de la Defensa contribuyeron al proyecto colaborativo que involucró la rama de la Future Land Warfare (Guerra Terrestre del Futuro) del ejército australiano.

Así lo indican al final de la descripción del vídeo:

Juntos, nos esforzamos por transformar la protección y eficiencia de nuestras fuerzas de defensa en un entorno cada vez más acelerado que exige cambios tecnológicos.

A través de esta colaboración, estamos probando el ámbito de las posibilidades que garantizarán que estemos #FutureReady.

El cargo Preparados para el futuro: Militares ensayan señales mentales con IA para controlar roboperros de combate apareció primero en Tecnovedosos.



source https://tecnovedosos.com/control-mental-roboperros-combate/

El DJ de Spotify impulsado por inteligencia artificial ofrecerá recomendaciones y datos de canciones

Spotify, el servicio de transmisión de música, ha lanzado un producto impulsado por inteligencia artificial (IA) llamado DJ. Este servicio se lanzó en los Estados Unidos y Canadá recientemente, según un comunicado de prensa de la empresa.

Las sugerencias personalizadas son por lo que Spotify es conocido. La compañía ha utilizado el aprendizaje automático para comprender la música, sus usuarios y sus preferencias, y ha buscado combinarlos (juego de palabras intencionado) con éxito. En un momento en que las empresas están ansiosas por utilizar modelos de IA generativa en sus productos, Spotify también ha entrado en la refriega. Sin embargo, ha ido más allá de utilizar solo las capacidades de ChatGPT y ha desarrollado un influyente DJ de IA dentro de la aplicación.

El DJ de IA de Spotify

Al igual que el algoritmo convencional de Spotify, el nuevo DJ impulsado por IA también escanea los nuevos lanzamientos para encontrar coincidencias con los gustos y disgustos de los usuarios. Spotify puede fácilmente organizar canciones para que las escuches, y lo ha estado haciendo a través de sus propias listas de reproducción sugeridas, como Discover Weekly o la campaña Wrapped con la que cierra el año calendario.

El DJ de IA es el siguiente nivel de recomendación, ya que no solo comienza a reproducir canciones para ti, sino que también te proporciona comentarios sobre la próxima canción y los artistas antes de que te sumerjas en la música.

Para esto, Spotify primero confió en sus editores humanos para proporcionar información y contexto perspicaces sobre la música, los artistas y el género. Luego, utilizó OpenAI para ampliar la experiencia de los editores y personalizarla para cada usuario.

La combinación de ambos enfoques es el corazón de lo que Spotify está haciendo con el DJ. Sin embargo, en lugar de quedarse solo ahí, la compañía ha utilizado Sonantic, la plataforma de voz dinámica de IA que adquirió el año pasado, para proporcionar voces realistas al texto.

Los usuarios habituales de Spotify pueden haber notado a estas alturas que la voz del DJ es bastante similar a la del anfitrión del primer programa matutino de Spotify, The Get Up. La voz y personalidad de Xavier Jernigan, conocido popularmente como «X», fue apreciada por muchos oyentes y el programa fue bastante popular. Aunque X se ha convertido en el Jefe de Asociaciones Culturales en Spotify, también ha dedicado tiempo a entrenar la voz del DJ impulsado por IA.

Spotify tiene previsto seguir mejorando este producto mediante la iteración y tomando en cuenta los comentarios de los usuarios, tal como lo hacen otras empresas con sus productos impulsados por IA. Si eres un cliente premium de Spotify en Estados Unidos o Canadá, puedes encontrar la tarjeta del DJ en tu feed de música en la aplicación de Spotify y dejar que reproduzca música con comentarios para ti.

Si no te gusta lo que la IA está ofreciendo, simplemente presiona el botón de nuevo y aparecerán nuevas recomendaciones.

El cargo El DJ de Spotify impulsado por inteligencia artificial ofrecerá recomendaciones y datos de canciones apareció primero en Tecnovedosos.



source https://tecnovedosos.com/dj-spotify-ia/