Les gens recherchent des photos de recherche sur le chatgpt, et cela fonctionne en fait

Les gens recherchent des photos de recherche sur le chatgpt, et cela fonctionne en fait

Cette semaine, OpenAI a annoncé ses derniers modèles: O3 et O4-MinI. Ce sont modèles de raisonnementqui décompose une invite en plusieurs parties qui sont ensuite traitées une à la fois. L’objectif est que le bot «réfléchit» à une demande plus profondément que les autres modèles ne le pouvaient et arrivent à un résultat plus profond et plus précis.

Bien qu’il existe de nombreuses fonctions possibles pour le modèle de raisonnement «le plus puissant» d’OpenAI, une utilisation qui a explosé un peu sur les réseaux sociaux est pour la géoguessing – l’acte d’identifier un emplacement en analysant uniquement ce que vous pouvez voir sur une image. Comme TechCrunch l’a rapportéles utilisateurs de X publient sur leurs expériences pour demander à O3 de localiser des emplacements à partir de photos aléatoires et montrant des résultats élogieux. Le bot devinera où dans le monde il pense que la photo a été prise et décomposera ses raisons de réfléchir ainsi. Par exemple, il pourrait le dire à zéro sur une certaine plaque d’immatriculation couleur qui désigne un pays particulier, ou qu’il a remarqué une langue ou un style d’écriture particulier sur un panneau.

Selon certains de ces utilisateurs, Chatgpt n’utilise aucune métadonnée cachée dans les images pour l’aider à identifier les emplacements: certains testeurs éliminent ces données sur les photos avant de les partager avec le modèle, donc, théoriquement, cela fonctionne sur le raisonnement et la recherche Web seul.

D’une part, c’est une tâche amusante pour mettre le chatppt. Geoguessing fait fureur en ligne, donc rendre la pratique plus accessible pourrait être une bonne chose. De l’autre, il y a des implications claires en matière de confidentialité et de sécurité ici: une personne ayant accès au modèle O3 de Chatgpt pourrait utiliser le modèle de raisonnement pour identifier où quelqu’un vit ou reste en fonction d’une image autrement anonyme de la leur.

J’ai décidé de tester les capacités de géoguessing d’O3 avec des images fixes de Google Street View, pour voir si le battage médiatique Internet était à la hauteur. La bonne nouvelle est que, d’après ma propre expérience, c’est loin d’être un outil parfait. En fait, il ne semble pas que ce soit beaucoup mieux dans la tâche que les modèles non-saisonnés d’Openai, comme 4O.

Tester les compétences de géoguessing d’O3

O3 peut gérer des repères clairs avec une relative facilité: j’ai d’abord testé une vue depuis une autoroute au Minnesota, face à l’horizon de Minneapolis au premier plan. Il n’a fallu qu’une minute et six secondes au bot pour identifier la ville, et nous avons obtenu que nous regardions I-35W. Il a également identifié instantanément le Panthéon à Paris, notant que la capture d’écran était à partir du moment où elle était en cours de rénovation en 2015. (Je ne savais pas que lorsque je l’ai soumise!)

Ensuite, je voulais essayer des monuments et des emplacements non célèbres. J’ai trouvé un coin de rue aléatoire à Springfield, Illinois, avec l’église baptiste centrale de la ville – un bâtiment en brique rouge avec un clocher. C’est à ce moment que les choses ont commencé à devenir intéressantes: O3 a recadré l’image en plusieurs parties, à la recherche d’identification des caractéristiques dans chacun. Comme il s’agit d’un modèle de raisonnement, vous pouvez également voir ce qu’il recherche dans certaines cultures. Comme d’autres fois, j’ai testé des modèles de raisonnement, c’est bizarre de voir le bot « penser » avec des interjections humaines. (par exemple, « hmm », « mais attendez » et « je me souviens » « ) Il est également intéressant de voir comment il choisit des détails spécifiques, comme notant le style architectural d’une section d’un bâtiment, ou où dans le monde un certain banc de parc est le plus souvent visible. Selon l’endroit où le bot est dans son processus de réflexion, il peut commencer à rechercher le Web pour plus d’informations, et vous pouvez cliquer sur ces liens pour enquêter sur ce qu’il fait référence vous-même.

Malgré tout ce raisonnement, cet emplacement a perturbé le bot et il n’a pas été en mesure de terminer l’analyse. Après trois minutes et 47 secondes, le bot semblant Comme si c’était près de le comprendre, en disant: «L’emplacement au 400 E Jackson Street à Springfield, IL pourrait être près de l’église de la cathédrale de St. Paul. Ma récolte n’a pas capturé toute la planche, donc j’ai besoin d’ajuster les coordonnées et de tester la boîte de délimitation. Alternativement, l’architecture pourrait aider à l’identifier – une revive grecque à briques avec une ouverture blanche avec une hauteur élevée. Le terme «rédempteur» pourrait se rapporter à «l’église luthérienne du rédempteur». Je vais rechercher à ma mémoire plus de détails sur les repères près de cette adresse. »

Le bot a correctement identifié la rue, mais plus impressionnant, la ville elle-même. J’ai également été impressionné par son analyse de l’église. Alors qu’il avait du mal à identifier l’église spécifique, il a pu analyser son style, ce qui aurait pu le mettre sur la bonne voie. Cependant, l’analyse s’est rapidement effondrée. La prochaine «pensée» concernait la façon dont l’emplacement pourrait être à Springfield, Missouri ou Kansas City. C’est la première fois que je voyais quelque chose sur le Missouri, ce qui m’a fait me demander si le bot a halluciné entre les deux Springfields. De là, le bot a perdu l’intrigue, se demandant si l’Église était à Omaha, ou peut-être que c’était le manoir du gouverneur de Topeka (qui ne ressemble vraiment à l’église).

Il a continué à réfléchir pendant encore quelques minutes, en spéculant sur d’autres emplacements dans lesquels le bloc pourrait être dans, avant de faire une pause complètement. Cela a suivi avec une expérience ultérieure que j’avais testé une ville aléatoire au Kansas: après trois minutes de réflexion, le bot pensait que mon image provenait de Fulton, Illinois – bien que, à son crédit, il était presque sûr que l’image provenait de quelque part dans le Midwest. Je lui ai demandé de réessayer, et il a réfléchi un moment, deviner encore une fois des villes forestières dans divers États, avant de faire une pause pour de bon.

Ce n’est pas le moment de peur

Le fait est que GPT-4O semble être même avec O3 en ce qui concerne la reconnaissance de l’emplacement. Il a pu identifier instantanément cette ligne d’horizon de Minneapolis et a immédiatement deviné que la photo du Kansas était en fait dans l’Iowa. (C’était incorrect, bien sûr, mais c’était rapide à ce sujet.) Cela semble s’aligner sur les expériences des autres avec les modèles: TechCrunch a pu obtenir O3 pour identifier un emplacement que 4O ne pouvait pas, mais les modèles étaient égalés uniformément à part cela.

Bien qu’il y ait certainement des problèmes de confidentialité et de sécurité avec l’IA en général, je ne pense pas que l’O3 en particulier doit être désigné comme une menace spécifique. Il peut être utilisé pour deviner correctement où une image a été prise, bien sûr, mais elle peut également se tromper facilement – ou s’écraser entièrement. Étant donné que 4O est capable d’un niveau de précision similaire, je dirais qu’il y a autant de préoccupation aujourd’hui qu’au cours de la dernière année. Ce n’est pas supermais ce n’est pas désastreux non plus. Je économiserais la panique pour un modèle d’IA qui le fait presque à chaque fois, surtout lorsque l’image est obscure.

En ce qui concerne les problèmes de confidentialité et de sécurité, OpenAI a partagé ce qui suit avec TechCrunch: «Openai O3 et O4-MinI apportent un raisonnement visuel à Chatgpt, ce qui les rend plus utiles dans des domaines tels que l’accessibilité, la recherche ou l’identification des lieux dans une réponse d’urgence. Politiques sur la vie privée. « 

Total
0
Shares
Previous Post
Horaire de la saison 3 de la Saison 3: Date de sortie de l'épisode 12 & amp; Temps

Horaire de la saison 3 de la Saison 3: Date de sortie de l’épisode 12 & amp; Temps

Next Post
Date de sortie de la saison 2 de la saison 2 de la saison 12 de la saison 2 & ampli; Temps

Date de sortie de la saison 2 de la saison 2 de la saison 12 de la saison 2 & ampli; Temps

Related Posts