About this board

Previous discussion was archived at User talk:VIGNERON/Archive 1 on 2015-09-01.

FoeNyx (talkcontribs)

Salut VIGNERON,

J’ai essayé de relancer la création de Wikidata:Property proposal/TOPO id en mettant plus d’infos, et comme tu avais participé à la création de son prédécesseur le code FANTOIR (P3182), peut-être pourrais-tu m’indiquer s’il manque des informations pour que la procédure aboutisse ? Si la propriété est effectivement créée, sais-tu comment procéder pour faire la conversion des 62k entrées fantoir existantes sur wikidata ? (j'ai rajouté un exemple de conversion dans la page de proposition, faut-il fournir un fichier csv de correspondance et demander à un dresseur de bot ? )

Cordialement

VIGNERON (talkcontribs)

Salut,

J'ai voté pour et notifié le créateur de propriété. Il me semble que c'est plutôt bon. J'ai juste deux questions :

  • y a-t-il une page en ligne vers laquelle pointer ? (ce n'est pas obligatoire formellement mais c'est une habitude courante et c'est généralement attendu pour un identifiant).
  • pour les codes de région/département/ville, est-ce vraiment juste des espaces simples ? est-ce que des tirets bas ne serait pas équivalent ? (en tout cas, ce serait plus lisible)

Pour la conversion, un fichier CSV de correspondance serait l'idéal, et cela pourrait être traiter avec OpenRefine (pas besoin d'un bot pour une "simple" conversion"). Pour ton exemple, il ne fonctionne que pour les voiries (et assimilés), non ?

Cdlt,

FoeNyx (talkcontribs)
  • « y a-t-il une page en ligne vers laquelle pointer ? » : J'avais mis cette URL dans Fichier TOPO (Q126543075)site officiel (P856) : https://data.economie.gouv.fr/explore/dataset/topo-fichier-des-entites-topographiques/information/ et je viens de voir qu'on y trouve un fichier descriptif, mis à jour début octobre ( https://data.economie.gouv.fr/api/datasets/1.0/topo-fichier-des-entites-topographiques/attachments/description_fichier_topo_20241003_pdf/ ) qui décrit plus en détails les éléments du code, en tout cas pour la partie française. J'étais passé à côté de ces explications avant, mais ça semble cohérent avec ce que j'en avais déduit. Le document descriptif n’est pas toujours cohérent avec les données dans le fichier : il décrit par exemple le niveau de type 32 comme étant des "communes étrangères" mais y on trouve en autre "99217000105511 32;NAGASAKI-KEN", où ken 県 est le suffixe des préfectures-départements japonais, alors qu'on devrait plutôt imaginer le libellé NAGASAKI-SHI ou simplement NAGASAKI pour la ville éponyme.
  • « est-ce vraiment juste des espaces simples » Dans le fichier ce sont des espaces simples. Il faudrait demander aux gens de la DGFiP si on peut utiliser des "_" (ou le symbole de représentation explicite des espaces "␣") comme équivalent, ce qui aurait l’avantage d'éviter le risque de coalescence des espaces consécutives dans les navigateurs.
  • « Pour la conversion, un fichier CSV de correspondance serait l'idéal » Je vais voir si je peux faire les extractions de wikidata et préparer un fichier CSV.
  • « Pour ton exemple, il ne fonctionne que pour les voiries (et assimilés), non ? » Oui, mais je pense que la très grande majorité des codes fantoirs actuellement renseignés sur wikidata concernent des élément de niveau voirie, non ? Pour que ça marche avec les communes, il suffirait de changer le suffixe/type du code topo de "14" à "13" si la partie rivoli est vide. J'ai mis à jour le code d'exemple de conversion pour gérer les communes (si il y en a)

Cordialement

Reply to "Conseils pour le code TOPO"

Demande d'avis sur une modification d'envergure

26
Maxime Ravel (talkcontribs)

Salut, VIGNERON !

Pour faire suite à notre échange de septembre dernier sur le sujet, je voudrais entreprendre, lorsqu'il y a lieu, de préciser les déclarations concernant les auteurices en occitan provençal, en ne gardant plus que la valeur concernant ce dialecte (exit donc la valeur générique concernant l'occitan). Au moins pour celleux qui utilisent la graphie mistralienne, en tout cas (ce qui peut être précisé avec cette propriété. Ma source principale serait le Répertoire des écrivains de langue provençale (langue mistralienne) de Roumanille à nos jours(130670332), et d'autres ponctuellement pour les auteurices plus récent(e)s et qui ne figureraient pas dans cet ouvrage qui remonte à 2006.

Mais comme c'est une grosse modification en perspective, je voudrais m'assurer de son bien-fondé... Pourrais-tu s'il te plaît me confirmer que c'est une bonne pratique ?

Bien à toi ! Maxime 16:31, 27 October 2024 (UTC)

VIGNERON (talkcontribs)

Salut,

Ajouter des précisions, surtout en se basant sur une source me semble une bonne idée. Par contre, que souhaites-tu faire exactement ? remplacer ou préciser ? (attention à rester cohérent avec les sources)

Sinon, il y a quelque chose d'étrange dans ta requête SPARQL, dans "wdt:P6886*" l'étoile ne sert à rien (puisque les valeurs en P6886 n'ont pas de P6886 elles-mêmes). Si on essaye avec et sans l'étoile, on voit bien que les résultats sont exactement les mêmes. Est-ce que tu cherchais plutôt ceci https://w.wiki/Bijc ? (langues d'écriture (P6886)occitan (Q14185) sans utilise (P2283) en qualificatif).

Cdlt,

Maxime Ravel (talkcontribs)

Merci pour cet avis !

Là où il y a lieu, je souhaiterais remplacer la valeur occitan par la valeur provençal, puisque tu m'avais dit que maintenir les deux constituerait une redondance (si on écrit en provençal on écrit forcément aussi en occitan, puisque le premier est un dialecte du second).

Quant à l'étoile c'est une erreur, je vais la virer.

VIGNERON (talkcontribs)

Ce que je me demande (et je n'ai pas de réponse définitive), est vaut-il mieux :

langues d'écriture (P6886)occitan (Q14185)utilise (P2283)provençal rhodanien (Q118664294)

ou

langues d'écriture (P6886)provençal rhodanien (Q118664294)

Le premier me semble plus direct mais le premier n'est pas formellement redondant.

Reste la question de la redondance apparente de Q119892265#P1412, est-ce que cette personne parle à la fois l'occitan standard et le dialecte niçois ou non ? Je notifie CaféBuzz qui pourra en dire plus.

Maxime Ravel (talkcontribs)

En effet, tout est là ! C'est justement ce que je voudrais savoir avant de me lancer.

Vu son époque, je pense qu'Emanuel ne s'exprimait qu'en niçois.

(Et petit détail au passage, certain(e)s auteurices en provençal maritime utilisent ou ont utilisé aussi la graphie mistralienne, qui n'est donc pas cantonnée au rhodanien.)

Maxime Ravel (talkcontribs)

Du reste, pour ce qui est des sources, celle qui est la plus employée en la matière est apparemment le Dictionnaire de Fourié, lequel ne précise jamais dans les notices (sauf erreur) l'idiome dans lequel s'exprime chaque auteurice. Je pense que l'auteur des déclarations s'est juste basé sur le titre de l'ouvrage (auteurs en langue d'oc).

CaféBuzz (talkcontribs)

Bonjour,


Il me semble logique que le champ contienne la langue et non pas le dialecte ou le sous-dialecte. On pourrait se perdre en arguties sur la question de savoir s'il vaut mieux indiquer que Mistral écrit en occitan, en provençal ou en provençal rhodanien. Pareil par exemple pour Max Rouquette, occitan, languedocien ou montpelliérain. Et pour des centaines d'autres. Wikidata est une base de donnée censée rapporter les informations rapportées par des sources, pas se livrer à des choix éditoriaux. À titre d'exemple, la BNF ne retient en principe que la mention « occitan » sans se préoccuper du dialecte (confirmé après un échange avec eux au sujet de multiples incohérences et erreurs que j'ai pu trouver dans leurs fiches ; autre chose est qu'ils refusent de corriger les erreurs lorsqu'on leur signale...). Le champ devrait pouvoir accueillir en plus de la langue une hiérarchie d'idiomes pour pouvoir contenir toutes les informations attestées sans redondance. Dans un autre contexte, prenons l'exemple de Céline Dion, ira-t-on indiquer qu'elle parle québecois ou français ? Évidemment on indique français, mais on devrait aussi pouvoir indiquer son dialecte.

Maxime Ravel (talkcontribs)

Merci pour cet avis. Cependant sur la mention des sous-ensembles linguistiques (dialectes, sous-dialectes, etc.), je crains de ne pas être tout à fait d'accord. Je crois qu'il faut suivre les sources fiables, et en l'occurrence il me semble assez unanimement attesté que Mistral pratiquait le rhodanien. Pour Rouquette, je connais encore trop mal son œuvre et la littérature critique à son propos pour en juger. Mais il est rare qu'il y ait des divergences sur l'idiome employé, en fait elles portent plutôt sur le statut dudit idiome (mais justement, les éléments des auteurices ne sont pas le lieu pour exposer ces controverses, il me semble).

Aussi la mention des deux me semble-t-elle quand même assez redondante, à bien y réfléchir. Mais mon avis reste ouvert.

Maxime Ravel (talkcontribs)

Il faudrait peut-être aussi voir quel est l'esprit qui a présidé à la création de P1412 : cette propriété avait-elle vocation à se limiter aux langues, ou à inclure également les sous-ensembles linguistiques ?

VIGNERON (talkcontribs)

Sur Wikidata, on ne se limite généralement pas aux langues. Que ce soit P1412, P6886, etc. on accepte tout languoïde.

Côté, BnF, je viens de faire une requête SPARQL sur leurs données et je vois qu'ils se basent sur l'ISO 639-2B et qu'il n'y a pas non plus que des langues stricto sensu : https://data.bnf.fr/sparql/#query=PREFIX%20foaf%3A%20%3Chttp%3A%2F%2Fxmlns.com%2Ffoaf%2F0.1%2F%3E%0APREFIX%20bio%3A%20%3Chttp%3A%2F%2Fvocab.org%2Fbio%2F0.1%2F%3E%0ASELECT%20%3Flang%20(COUNT(%3Fa)%20AS%20%3Fnb)%0AWHERE%20%7B%0A%3Fa%20%3Chttp%3A%2F%2Frdvocab.info%2FElementsGr2%2FlanguageOfThePerson%3E%20%3Flang%20.%0A%7D%0AGROUP%20BY%20%3Flang%0AORDER%20BY%20DESC(%3Fnb) (on voit par exemple chinois ou alémanique et même "non applicable" - utilisé surtout pour des musiciens ?!?). Et oui, la BnF ne corrige plus les erreurs signalées.

Dans tout les cas, le mieux est effectivement de suivre les sources mais il faut prendre les meilleures sources disponibles (or la BnF est vite limitée, les dictionnaires citées me semble à privilégier si possible).

Au final et pragmatiquement, je pense que la meilleure solution de compromis serait d'indiquer la langue avec le dialecte en qualificatif. Qu'en pensez-vous ?

CaféBuzz (talkcontribs)

Je suis d'accord, et cela permettrait d'indiquer plusieurs valeurs sans redondance (à défaut de disposer d'une vue hiérarchique).

CaféBuzz (talkcontribs)

Pour la BNF je me référais uniquement à l'occitan car c'est à ce sujet que je les avais contactés.

Maxime Ravel (talkcontribs)

Bon, d'accord aussi ! L'important est surtout de garder le degré de precision. Je vais modifier en ce sens les quelques déclarations avec provençal en valeur.

CaféBuzz (talkcontribs)

Je n'ai donné que deux exemples notoires, mais il est facile de se rendre compte que dans de nombreux autres cas on pourrait se lancer dans des discussions sans fin à ce sujet (qu'en est-il des auteurs gardois dont le dialecte est le provençal ? De ceux, et il y en a un certain nombre à l'âge d'or du Félibrige, qui écrivaient en rhodanien alors qu'ils n'étaient pas eux-même provençaux ? Des auteurs antérieurs au Félibrige ? de Victor Gelu, qui écrivait en parler marseillais et rejetait la graphie mistralienne ?...), les limites du provençal ne coïncident pas avec celles de la Provence (on parle provençal hors de Provence et on parle vivaro-alpin dans une partie de cette région), que fait-on de ceux qui ont utilisé plusieurs graphies... Ce n'est pas une question d'être unanimement attesté, personne ne conteste que Mistral écrivait en rhodanien, et il est tout aussi bien attesté que Rouquette écrivain en occitan, il est le plus grand écrivain dans cette langue du XXe siècle, en dialecte languedocien et en parler montpelliérain. Je me répète : WD est une base de données qui doit rapporter des données attestées, pas se livrer à des choix éditoriaux selon des critères discutables.

Maxime Ravel (talkcontribs)

Je pense que tous les cas de figure que tu évoques peuvent être gérés sans trop de difficultés par des déclarations et qualificatifs idoines. Mais nous pourrons en reparler si un cas litigieux se présente. (Et je sais bien qu'on parle provençal hors des limites administratives de la Provence, étant moi-même un locuteur originaire de Petite Camargue...)

VIGNERON (talkcontribs)

CaféBuzz pour le coup ça c'est une question très facile, comme tu le dis : on suit ce que disent les sources.

CaféBuzz (talkcontribs)

Tout à fait, la question est comment gérer la redonance de l'information en conservant le degré de précision de chaque source. J'ai compulsé le dictionnaire de Jean Fourié, qui est l'ouvrage de référence sur le sujet, et il n'indique pratiquement jamais le dialecte.

Maxime Ravel (talkcontribs)

Exact.

Maxime Ravel (talkcontribs)
CaféBuzz (talkcontribs)

Ça correspond à ce que j'avais fait (très partiellement), je n'avais rien trouvé de mieux.

VIGNERON (talkcontribs)

Cela me semble bien.

Maxime Ravel (talkcontribs)
VIGNERON (talkcontribs)

Comme ceci : https://w.wiki/Bj2G (j'ai pris système d'écriture (P282)norme mistralienne (Q930193)).

Maxime Ravel (talkcontribs)

Merveilleux, merci beaucoup. Cela va m'être très utile

Maxime Ravel (talkcontribs)

Salut, serait-ce abuser de te demander de m'aider à inclure un autre paramètre à la requête ? Je voudrais que les auteurices soient classé(e)s par ordre croissant de leur date de naissance, si possible en faisant apparaître les dates...

VIGNERON (talkcontribs)
Reply to "Demande d'avis sur une modification d'envergure"
Bouzinac (talkcontribs)

Hello, je suis tombé sur un modèle préformaté de requêtage de valeurs différentes pour une même propriété : quelles sont les items ayant plusieurs P5817. Le hic, est que ça compte même les items avec une P5817 en rang préféré (=1 seule valeur au final). Comment faire pour que ça cherche les P5817 ayant plusieurs valeurs de même rang ?

https://w.wiki/BHXo

VIGNERON (talkcontribs)

Hmm, est-ce que ce que tu cherches n'est pas simplement la requête SPARQL de la contrainte "meilleure valeur unique" ? que l'on trouve sur Property talk:P5817 ; d'ailleurs, sauf erreur, la contrainte "Une seule valeur" - dont tu as repris la requête - devrait sans doute être supprimée.

Bouzinac (talkcontribs)

Super, exactement.

Les modèles pré formatés, je ne dirais pas forcément qu'ils sont à supprimer mais dont la doc devrait être clarifiée, texte mieux explicité quoi

VIGNERON (talkcontribs)

Je parlais de la contrainte elle-même et pas du modèle, il me semble que les deux contraintes font doublon ; je vais demander sur la propriété elle-même où les personnes concernées sauront mieux me dire.

Reply to "Adaptation d'une requête"
Nono314 (talkcontribs)

Bonjour Vigneron,

Tu avais fait créer les propriétés pour les différents inventaires régionaux (la plupart sous Gertrude), merci à toi !

Tu disais à l'époque one for each French region. Toutes ? Non ! Car une résistait : le Grand-Est :)

À l'époque c'était en effet le bazar, avec 3 bases distinctes héritées des anciennes régions, liées depuis le portail de la nouvelle mais dysfonctionnelles. Mais maintenant qu'on a une belle base unique, est-ce que tu pourrais combler ce manque ?

Cela permettrait au passage de réaffecter les quelques monuments ardennais égarés sur l'inventaire d'une autre contrée.

Merci

VIGNERON (talkcontribs)

Bonjour,

Je pourrais faire la proposition, mais quand je vois que les propriétés pour les autres régions sont quasiment inutilisées, je suis un peu hésitant. Je regarde ça plus en détail dans la semaine (et d'ici là, n'hésite pas à regarder voire à essayer sur Wikidata:Property proposal).

Cdlt,

Nono314 (talkcontribs)

Merci pour ta réponse.

Il y a un peu de travail avant que toutes les régions aient la même couverture que la Bretagne, mais l'utilisation n'est pas si insignifiante...

Et si ça peut te rassurer, ma demande n'était pas désintéressée, j'ai bien l'intention d'utiliser la propriété, prioritairement pour l'Alsace mais aussi de façon plus large.

VIGNERON (talkcontribs)
Nono314 (talkcontribs)

Merci beaucoup, je regarde ça !

Reply to "Gertrude dans le Grand-Est"
Bouzinac (talkcontribs)

Hello, une petite question de requêtage : je voulais les éléments ayant pour seule P31 = Q55493 (et aucune autre P31). J'ai pas l'impression que ce soit bon, si? https://w.wiki/BDw7

VIGNERON (talkcontribs)

Salut Bouzinac,

Bonne question. Il y a peut-être plus efficace mais dans ce genre de cas, je préfère passer par un décompte du nombre de value : https://w.wiki/BEBd.

Bouzinac (talkcontribs)

Exactement mon besoin. Merci !

Reply to "Query"
Veyndan (talkcontribs)
VIGNERON (talkcontribs)

Hello,

It's a bit of a complicated issue and there is two separate problems:

  • first you did a self-reference (adding the state as the capital of the state itself), if you really want to add such data, please use separate items (like Monaco (Q235)capitale (P36)Monaco-Ville (Q55115) or commune de Monaco (Q3685392)).
  • then, The World Factbook seems incorrect, these 2 city-states don't have a capital - clearly not de jure and probably not even de facto. The "no value" fits better the reality and should be preferred.

Cheers,

Reply to "Capital reversions"
Jimkats (talkcontribs)

Hi, I saw you removed the statement described at URL (P973) from several articles about castles/fortresses in Greece, and I just read below why you did it (that the URL is already mentioned in identifiers pretty much) which makes sense, but I believe it isn't much helpful because not all identifiers of an item act as description of that item, but usually as an index. So, having an explicit statement where it is mentioned the URL that best describes that item is a good idea to have, even if that same URL exists elsewhere in the item.

VIGNERON (talkcontribs)

Hi,

I understand the nuance you're trying to make but Redundancy is a very bad practice which only cause problem and should be avoided at all cost (a few people started Wikidata:WikiProject Redundancy).

I removed ~150 000 duplicate statements with P973 and I'll remove more in the future. If you really want to say that an identifier is more than just identifying, there is several other options: put a qualifier on the statements or (if the whole database is concerned) put a statement of the identifier property.

Cheers,

Reply to "Removal of {{P|973}}"

Romeo and Juliet (Q19101569)

2
Summary last edited by Uzume 18:36, 2 August 2024 3 months ago

Discussion moved to the Talk:Q19101569

Uzume (talkcontribs)

Yes, one file is an extract from another much larger publication.

Uzume (talkcontribs)

I really do not like this discussion editor. I will continue to discuss this with you at: Talk:Q19101569. Thank you.

Reply to "Romeo and Juliet (Q19101569)"

"décrit à l'URL (P973)" : déclaration retirée

4
Le Passant (talkcontribs)

Bonjour Vigneron,

Je vois que tu retiré la déclaration de description faisant le lien avec la plateforme ouverte du patrimoine. Il me semblait pourtant que ce lien apportait des informations vérifiées et pertinentes sur l’œuvre... Quelque chose doit m'échapper ! Peux-tu m'éclairer ?

Bien cordialement, ~~~~

VIGNERON (talkcontribs)

Bonjour,

Oui, j'ai retiré les liens en décrit à l'URL (P973) quand le lien était déjà présent avec une propriété identifiant spécifique, inutile d'avoir deux fois le même lien sur un élément.

Cdlt,

Le Passant (talkcontribs)

Merci de ta réponse par retour ! Désolé, c'est évident, mais je n'avais pas vu l'identifiant MNR...

VIGNERON (talkcontribs)

Pas de problème, même les choses les plus évidentes vont mieux en le disant explicitement (j'aurais du le mettre dans le résumé de modification d'ailleurs, je le ferais les prochaines fois).

Reply to ""décrit à l'URL (P973)" : déclaration retirée"

Pocket Oxford-Hachette French Dictionary: English-French ID

1
Soufiyouns (talkcontribs)
Reply to "Pocket Oxford-Hachette French Dictionary: English-French ID"