A magyar weben mondjuk van 1-1.5M oldal ami nem kezelhetetlen.
Szerintem mindenképpen valami piciben kellene elkezdeni pl: Ingatlan kereső, comment kereső, recept stb. A mai technológiákkal nagyon felül tudod múlni szinte bármilyen site belső keresőjét akik még a LIKE és MySQL FullText-nél tartanak.
Van már szinte minden hozzá: NoSQL, Lucene, ElasticSearch, NodeJS, Apache Mahout, Hadoop, stb.
Könyvjelzők