!bgslixpNIwVQloUVCx:grin.hu

OSM szerszámzat

17 Members
OpenStreetMap hozzájárulás kapcsán: parszerek, transzformációk, importálók, crawlerek wiki.openstreetmap.org/wiki/Hungary/Szersz%C3%A1mzat magyar7 Servers

Load older messages


SenderMessageTime
4 May 2021
@bkil:grin.hubkilCsak kéne már egy crawler ami szólna hogyha olyan xls/pdf dokumentumot talál amiben elég sokszor szerepel az út, utca vagy egy városnév.11:37:10
@mugli:grin.humugliEz szerintem GDPR miatt aggályos…11:38:35
@bkil:grin.hubkilURL-ek gyűjtése nem ütközhet semmilyen szabályba.11:38:53
@bkil:grin.hubkilAzt, hogy utána valaki 1-1 szép példány megnyit magának (ami már eleve publikus weboldalon elérhető), esetleg kimásolja belőle a címsorokat és berakja egy adatbázisba ami alapján házszámokat validál, az mindenkinek a lelkiismeretére van bízva.11:39:56
@mugli:grin.humugliA dereferálás igen.11:40:05
@bkil:grin.hubkilNem hinném. Publikus weboldalon mugli.hu/cimeim kattintok egy PDF-re akkor már mehetek is a rácsok mögé?11:40:34
@mugli:grin.humugli2014ben nem ezt mondta a nemzetbiztonsági vendégelőadó. Lelked rajta.11:40:47
@bkil:grin.hubkilSzerintem kiragadod az én általam elmondottakat és az ő általa elmondottakat is egy olyan kontextusban amiben már nem igazak. De ha akarod gyorsabb lehet szóban megbeszélni, találkozzunk tegnap este 7-kor!11:41:27
@bkil:grin.hubkil Ha én magánszemélyek nevét, lakcímét és telefonszámát gyűjtöm (adatbázisban, txt, stb), az nyilván GDPR. Esetleg ha szexuális bűnözők címeit egy táblázatban. De amíg az ország összes lakcímét gyűjtöm egyben, a rendezés igényessége nélkül, az nem alkalmas személyes azonosíthatóságra vagy inkriminációra, és még ráadásul szerzői jogi aggályokat sem vethet fel. 11:45:34
@bkil:grin.hubkilAmennyiben cég címeit és neveit (tevékenységi köreit?) gyűjtöm, az egyrészt személyhez fűződő jogokkal amúgy sem rendelkezne, másrészt a cégnyilvántartásban, közlönyben stb szerint amúgy is publikálva kerül rengeteg helyen.11:46:34
@bkil:grin.hubkil
In reply to @mugli:grin.hu
2014ben nem ezt mondta a nemzetbiztonsági vendégelőadó. Lelked rajta.

Amúgy már sokadik alkalommal van ez a FUD-olás, de honnan jön? Esetleg van valami ellenérdekeltség amivel nem vagyok tisztában?

  • https://en.wikipedia.org/wiki/Fearmongering
  • https://en.wikipedia.org/wiki/Fear,_uncertainty,_and_doubt
11:48:11
@kami:grin.hukami
In reply to @bkil:grin.hu

Nem tudom mik ezek a nyúlfarknyi címlisták, de hátha valakit inspirál vagy van más oldal ahol több a találat a címlista xls-re:

  • https://duckduckgo.com/?q=site%3Anmhh.hu+c%C3%ADmlista&ia=web
  • https://nmhh.hu/cikk/188832/Cimlista_a_PC194932017_szamu_kotelezo_hatarozathoz
Ha van engedély a geoadatokat is tartalmazó listához, akkor az engem inspirál.
11:50:14
@bkil:grin.hubkilEzek csak rövid listák (~500), bár lehet, hogy elég kitartó kereséssel rálelne valaki sokezresekre is. Remélhetőleg a legnagyobbakra már ráleltünk, bár időről időre random kormányzati oldalakon is felbukkanhatnak időszakosan vagy tartósan és a múltban csak a véletlenen múlt, hogy valamelyikünk felfedezte - ezért lenne jó automatizálni legalább az állami oldalak nézegetését.11:52:06
@vasony:grin.huvasony
In reply to @bkil:grin.hu
Ezek csak rövid listák (~500), bár lehet, hogy elég kitartó kereséssel rálelne valaki sokezresekre is. Remélhetőleg a legnagyobbakra már ráleltünk, bár időről időre random kormányzati oldalakon is felbukkanhatnak időszakosan vagy tartósan és a múltban csak a véletlenen múlt, hogy valamelyikünk felfedezte - ezért lenne jó automatizálni legalább az állami oldalak nézegetését.
nmhh-ból egy 1500-as listát használtunk a gimmisnben
13:00:34
@bkil:grin.hubkil Látom Erről tényleg mintha beszélgettünk volna. 13:06:30
7 May 2021
@bkil:grin.hubkil

Mik vannak:

  • https://munch.hu/wp-admin/admin-ajax.php?action=wcfmmp_stores_list_map_markers
20:11:52
@bkil:grin.hubkil
  • név, lat-lang (sic! 🤣), cím, az aloldalon telefonszám.
20:13:49
@bkil:grin.hubkil
  • Bár ikon alapján nincs megkülönböztetve, de a HTML forrásban van a POI típusra árulkodó osztály: class="product type-product post-6086 status-publish first instock product_cat-pekseg-munch product_cat-munch has-post-thumbnail sale taxable shipping-taxable purchasable product-type-simple"
20:16:52
@bkil:grin.hubkilElég szépen le van bontva product_cat-etterem-munch*, product_cat-kavezo-* product_cat-pekseg...20:24:39
@bkil:grin.hubkil * Elég szépen le van bontva product_cat-etterem-munch*, product_cat-kavezo-* product_cat-pekseg...20:24:47
@vasony:grin.huvasony szeretem amikor minden 1 sorban van... s/{/\n{/g 20:31:38
@bkil:grin.hubkilÉn pedig azt szeretem amikor JSON stringben ad vissza valaki JSON-t!20:32:21
@vasony:grin.huvasonymáris kiderült, hogy 279 címről van szó, nem éri el az ingerküszöböm20:34:03
@vasony:grin.huvasonypersze attól poi vadáaszatra jó lehet csak gimmisnben nem hasznos20:34:49
@bkil:grin.hubkil

Házszámnak nem sok, de POI-nak máris más - ráadásul naprakészen van tartva, akár napi-heti recrawlt is lehetne csinálni ha bekötné valaki ide:

  • https://github.com/alltheplaces/alltheplaces/tree/master/locations/spiders
20:34:52
@kami:grin.hukami Ha van engedély, hozzá csinálok hozzá importálót. 20:38:15
@bkil:grin.hubkil

További információk
Kerület V. kerület
Speciális étrend Cukormentes, Gluténmentes, Vegán, Vegetáriánus

Meg néha van még Google térkép link meg facebook hashtag (oldal?) is.

20:49:17
@bkil:grin.hubkilEz a vektortérkép tetszik nekem: https://community.osm.be/21:16:22
@bkil:grin.hubkil

Mármint ami a háttérben van (előtérben csempék) Ha jól látom 240kB és innen jön:

  • https://community.osm.be/completeFeatureCollection.min.json
21:19:50
11 May 2021
@server_stats:nordgedanken.devServer Stats Discoverer (traveler bot) set a profile picture.12:38:28

There are no newer messages yet.


Back to Room List