Maison / Technologie / Comment Amazon, Apple, Google, Microsoft et Samsung traitent-ils vos données vocales?

Comment Amazon, Apple, Google, Microsoft et Samsung traitent-ils vos données vocales?

Alexa Cortana. Assistant Google. Bixby. Siri. Des centaines de millions de personnes utilisent chaque jour des assistants vocaux développés par Amazon, Microsoft, Google, Samsung et Apple, et ce nombre ne cesse de croître. Selon une récente enquête réalisée par une publication technique Voicebot90,1 millions d’adultes américains utilisent des assistants vocaux sur leur smartphone au moins une fois par mois, tandis que 77 millions les utilisent dans leur voiture et 45,7 millions sur des haut-parleurs intelligents. Juniper Research prédit son utilisation par les assistants vocaux triplera, passant de 2,5 milliards d'assistants en 2018 à 8 milliards en 2023.

Ce que la plupart des utilisateurs ne réalisent pas, c’est que les enregistrements de leurs demandes vocales ne sont pas immédiatement effacés. Au lieu de cela, ils peuvent être stockés pendant des années et, dans certains cas, ils sont analysés par des examinateurs humains assurance qualité et développement des fonctionnalités. Nous avons demandé aux principaux acteurs de l’assistant vocal comment ils géraient la collecte et la révision des données, et nous avons analysé leurs politiques de confidentialité pour obtenir plus d’indices.

Amazone

Amazon dit annoter un «très petit échantillon» d’enregistrements vocaux Alexa afin d’améliorer l’expérience client – par exemple, pour former des systèmes de reconnaissance de la parole et de compréhension du langage naturel «afin que Alexa puisse mieux comprendre… les demandes». les sous-traitants tiers pour examiner ces enregistrements, mais indiquent qu'ils disposent de «garanties techniques et opérationnelles strictes» pour empêcher les abus et que ces employés n'ont pas d'accès direct aux informations d'identification – uniquement les numéros de compte, prénoms et numéros de série de l'appareil .

"Toutes les informations sont traitées avec une grande confidentialité et nous utilisons une authentification à plusieurs facteurs pour limiter l'accès, le cryptage des services et des audits de notre environnement de contrôle pour le protéger", a déclaré un porte-parole d'Amazon dans un communiqué.

Dans les pages de paramètres Web et d'applications, Amazon offre aux utilisateurs la possibilité de désactiver les enregistrements vocaux pour le développement de fonctionnalités. Les utilisateurs qui choisissent de ne pas participer, ajoute-t-il, peuvent néanmoins faire analyser leurs enregistrements manuellement au cours du processus de révision.

Pomme

Apple discute du processus de révision de l'audio enregistré par Siri dans un livre blanc sur son page de confidentialité. Dans ce document, il explique que les «classeurs» humains examinent et étiquettent un petit sous-ensemble de données Siri à des fins de développement et d’assurance qualité, et que chaque relecteur classe la qualité des réponses et indique les actions correctes. Ces étiquettes alimentent des systèmes de reconnaissance qui améliorent «continuellement» la qualité de Siri.

Apple ajoute que les énoncés réservés à la révision sont cryptés, anonymisés et non associés aux noms ou identités des utilisateurs. De plus, les réviseurs humains ne reçoivent pas les identifiants aléatoires des utilisateurs (qui sont actualisés toutes les 15 minutes). Apple stocke ces enregistrements vocaux pendant une période de six mois, au cours de laquelle ils sont analysés par les systèmes de reconnaissance de Siri afin de "mieux comprendre" la voix des utilisateurs. Et après six mois, des copies sont sauvegardées (sans identificateurs) pour une utilisation dans l'amélioration et le développement de Siri pendant deux ans.

Apple permet aux utilisateurs de se retirer complètement de Siri ou d’utiliser leTapez à Siri”Outil uniquement pour les recherches dactylographiées ou verbalisées locales sur l'appareil. Toutefois, un "petit sous-ensemble" d'enregistrements, de transcriptions et de données associées sans identificateur peut continuer à être utilisé pour l'amélioration continue et l'assurance qualité de Siri au-delà de deux ans.

Google

Un porte-parole de Google a déclaré à Newstrotteur qu'il effectuait «une fraction très limitée de la transcription audio pour améliorer les systèmes de reconnaissance vocale», mais qu'il appliquait «un large éventail de techniques pour protéger la confidentialité des utilisateurs». Elle précise notamment que les extraits audio examinés ne sont pas exhaustifs. N'associez aucune information personnellement identifiable, et cette transcription est en grande partie automatisée et n'est pas gérée par les employés de Google. En outre, dans les cas où il Est-ce que utiliser un service tiers pour examiner les données, elle dit que «généralement» fournit le texte, mais pas l'audio.

Google indique également qu'il se dirige vers des techniques ne nécessitant pas d'étiquetage humain, et il publie des recherches à cette fin. Dans le domaine de la synthèse vocale, par exemple, sa Tacotron 2 Le système peut créer des modèles de synthèse vocale basés uniquement sur des spectrogrammes, tandis que son système WaveNet génère des modèles à partir de formes d'onde.

Google stocke des extraits audio enregistré par l'assistant de Google indéfiniment. Cependant, comme Amazon et Apple, il permet aux utilisateurs de supprimer définitivement ces enregistrements et se désengager des futures collectes de données – au détriment d’un assistant stérilisé et d’une expérience de recherche vocale, bien sûr. Cela dit, il convient de noter que dans sa politique de confidentialité, Google indique qu'il «peut conserver des informations relatives au service» afin de «prévenir le spam et les abus» et «d'améliorer (ses) services».

Microsoft

Lorsque nous avons sollicité nos commentaires, un représentant de Microsoft nous a signalé une page de support décrivant ses pratiques de confidentialité en ce qui concerne Cortana. La page indique qu'elle collecte des données vocales pour «(améliorer) la compréhension de Cortana» des habitudes de parole de chaque utilisateur et pour «continuer à améliorer» la reconnaissance et les réponses de Cortana, ainsi que pour «améliorer» d'autres produits et services qui utilisent la reconnaissance et l'intention de la parole. compréhension.

La page ne permet pas de savoir si les employés de Microsoft ou les sous-traitants effectuent des révisions manuelles de ces données et comment ces données sont anonymisées, mais la société indique que, lorsque la fonction «Hey Cortana» toujours à l'écoute est activée sur les ordinateurs portables et les ordinateurs compatibles, Cortana collecte les entrées vocales uniquement après avoir entendu son invite.

Microsoft permet aux utilisateurs de désactiver la collecte de données vocales, la personnalisation et la reconnaissance vocale en consultant un tableau de bord en ligne ou une page de recherche dans Windows 10. Comme on pouvait s'y attendre, le fait de désactiver la reconnaissance vocale empêche Cortana de répondre aux déclarations. Mais comme Google Assistant, Cortana reconnaît les commandes saisies.

Samsung

Samsung n'a pas immédiatement répondu à une demande de commentaire, mais le Page FAQ sur son site Web d’assistance Bixby décrit la façon dont il collecte et utilise les données vocales. Selon Samsung, il utilise les commandes et les conversations vocales (ainsi que des informations sur les versions de système d'exploitation, les configurations et paramètres de périphérique, les adresses IP, les identifiants de périphérique et d'autres identificateurs uniques) pour "améliorer" et personnaliser les expériences de produits, et pour exploiter l'historique des conversations passées. aidez Bixby à mieux comprendre les prononciations et les modèles de parole.

Une partie au moins de ces «améliorations» provient d’un «service tiers» non divulgué, qui fournit des services de conversion parole en texte, conformément à la politique de confidentialité de Samsung. La société note que ce fournisseur peut recevoir et stocker certaines commandes vocales. Et bien que Samsung n’indique pas combien de temps il stocke les commandes, il indique que ses politiques de rétention tiennent compte de «règles relatives aux limitations» et «au moins la durée d’utilisation (d'une personne)» de Bixby.

Vous pouvez supprimer des conversations et des enregistrements Bixby via l'application Bixby Home sur des appareils Samsung Galaxy.

Source

A propos newstrotteur-fr

Découvrez également

Diris Lemon, le parent Iris Nova, financera et distribuera des boissons de tiers

Iris Nova, la Coca-Cola-soutenu démarrage qui crée Dirty Lemon boissons, annonce son intention de dépenser …

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *