Kicsit jogi is a kérdés és etikai is, ráadásul technikai, azért nyitottam ide
Van egy partner, aki a weboldalán közli az új termékeket és a termékek lehetséges tulajdonságait (pl. ddr2 ram: 1gb, 2gb). A tulajdonság egy legördülő menüből választható ki.
Megnéztem az oldal forrását és onnan az adatok kinyerhetők. Léteznek is erre programok: data mining, scraping szavakra keresve. Nem ismeretlen technika ez.
A kérdésem több oldalról közelíti a problémát:
1. Van e jogom hozzá, hogy az adatokat ilymódon leszedjem valaki oldaláról? Voltaképp ugyanazt teszem, mintha egyenként végigkattintanám és kiírnám, ehelyett ráuszítok egy robotot.
2. Erkölcsileg mi a véleményetek róla? Próbáltam az adatokat elkérni valamilyen emészthető formátumban, de mindig visszapattanok azzal, hogy "ott van a weboldalon". Megmondom őszintén, hogy nekem elég, ha erkölcsileg megkérdőjelezhető a tett, akkor inkább nem tenném. De nem tudom mennyire gázos ügy leszedni tartalmat adatbázisnak. Végülis az adatbázisom így is-úgy is előáll, csak így könnyebben...
3. Ez már színtiszta technika
Ha az első két ponton átmegyek, akkor mivel lehet megvalósítani az adat kinyerést? Próbáltam egy-két scraper programot, de gyík vagyok hozzá. Létezik olyan, ami kifejezetten ezt tudja produkálni?
Végigmegy linkeken és bizonyos ismérvek alapján (nem tudom hogy fogalmazzam meg ezeket egyelőre) a talált adatokat kipakolja pl. egy excel fájlba.
Könyvjelzők