Ircam-Centre Pompidou

Recherche

  • Recherche simple
  • Recherche avancée

    Panier électronique

    Votre panier ne contient aucune notice

    Connexion à la base

  • Identification
    (Identifiez-vous pour accéder aux fonctions de mise à jour. Utilisez votre login-password de courrier électronique)

    Entrepôt OAI-PMH

  • Soumettre une requête

    Consulter la notice détailléeConsulter la notice détaillée
    Version complète en ligneVersion complète en ligne
    Version complète en ligne accessible uniquement depuis l'IrcamVersion complète en ligne accessible uniquement depuis l'Ircam
    Ajouter la notice au panierAjouter la notice au panier
    Retirer la notice du panierRetirer la notice du panier

  • English version
    (full translation not yet available)
  • Liste complète des articles

  • Consultation des notices


    Vue détaillée Vue Refer Vue Labintel Vue BibTeX  

    Catégorie de document Contribution à un colloque ou à un congrès
    Titre Multimedia classification of movie shots using low-level and semantic features
    Auteur principal Bertrand Delezoide
    Colloque / congrès ACM Multimédia. 2006
    Comité de lecture Oui
    Année 2005
    Statut éditorial Non publié
    Résumé

    Movie shots categorization may be approached by using audio and visual features for inferring high-level information about a movie shot. Low-level audio and visual features such as color and MFCC and mid-level features such as sky and speech detection have been used in multimedia understanding research. However, integrating all this features in a classifier remains a subject of study. In this paper, we propose a multimedia SVM fusion model, presented in Figure 1, for integrating knowledge from low-level and semantic features extracted from auditory and visual signal for scene classification of movie shots. We also compare our method with common approaches for feature integration based on Bayesian Network. Our computational results show that our model can achieve significantly better and more stable performance than other strategies.

    Mots-clés Multimodal information fusion / statistical modeling / video indexing / SVM / Bayesian network / early fusion / late fusion.
    Equipe Analyse et synthèse sonores
    Cote Delezoide05a
    Adresse de la version en ligne http://articles.ircam.fr/textes/Delezoide05a/index.pdf

    © Ircam - Centre Pompidou 2005.