Uncategorized

YouTube-8M : video dataset

par Alrick Deillon · Publié le 3 octobre 2016

Un dataset est un regroupement d’éléments (par exemple des images) qui seront catégorisées ou labelisées, permettant ainsi de les regrouper / filtrer selon des thèmes communs.

Les datasets labelisés ont permis une avancée non négligeable dans le domaine du machine learning. En guise d’exemple ImageNet, un énorme dataset d’images labelisées, ayant notamment permis des avancées considérables dans le domaine de la détection d’objets dans les images.

C’est dans cette idée que Google a lancé le tout récent YouTube-8M, un gigantesque dataset regroupant 8 millions de video YouTube labelisées selon 4800 entités, devenant ainsi le plus grand dataset vidéo actuellement disponible.

Interface de YouTube-8M

Les développeurs ont utilisé le système automatisé des annotations YouTube pour créer ce dataset, contrecarrant ainsi l’un des principaux problèmes des datasets vidéo, à savoir que l’annotation manuelle est un travail gargantuesque.

Sur YouTube-8M, un explorateur de dataset est disponible permettant de parcourir et rechercher les différentes entités en fonction de la catégorisation prévue par la plateforme.

Un des problèmes avec l’analyse vidéo, c’est que le traitement est très gourmand en ressources et que les vidéos demandent un grand espace de stockage. Ceci rend le travail des chercheurs souhaitant travailler avec ce genre de datasets beaucoup plus compliqué. Dans cette optique, les vidéos ont été prétraitées, permettant ainsi de fournir des extractions de caractéristique d’1 image par seconde compressées pour tenir sur un disque dur de moins d’1.5 TB. Cette possibilité permet aux chercheurs et étudiants n’ayant pas accès au Big Data des recherches bien plus poussées avec des datasets bien plus importants que précédemment.

Source

Article : https://research.googleblog.com/2016/09/announcing-youtube-8m-large-and-diverse.html
ImageNet : http://www.image-net.org/
YouTube-8M : https://research.google.com/youtube8m

Une carte numérique de l’Empire Romain

22 avril 2024 15:50 | By Alrick Deillon | No comments

À l’ère actuelle, les cartes numériques sont omniprésentes dans notre quotidien, nous guidant d’un point à un autre avec une facilité déconcertante. Cependant, cette technologie, si courante aujourd’hui, était inimaginable dans l’Antiquité. Imaginez si... Lire la suite →

YouTube-8M : video dataset

Source

Abonnez-vous à ce blog

D'autres billets intéressants

Une carte numérique de l’Empire Romain

PairDrop, pour transférer facilement des fichiers entre deux appareils sur toute plateforme

Nouveau site de présentation EDDB

OneDrive @ UniFR

Inscription à Teach & Learn Together Days (TLTD)