Oldal: 1 / 2 12 UtolsóUtolsó
Eredmény: 1 - 10 (12) összesen

Téma: Robots.txt - mindent letiltanék kivéve a főoldalt, de hogyan?

  1. #1
    Mindig van lejjebb Wirg logója
    Csatlakozott
    08-06-04
    Hely
    Budapest
    Hozzászólás
    1.988
    Begyűjtött 413 köszönetet
    215 hozzászólásával

    Alapbeállítás Robots.txt - mindent letiltanék kivéve a főoldalt, de hogyan?

    Sziasztok, a topik címe a problémám. Eddig több lehetséges verziót találtam, de nem vagyok bennük biztos:

    1.
    User-agent: Googlebot
    Allow: /index.html
    Disallow: /

    Ezzel az a bajom hogy ellentmondásnak tűnik és nem tudom hogy hogyan reagál rá a bot. Valakinek van tapasztalata? Melyik parancs az erősebb, számít hogy milyen sorrendben írom, stb?


    2.
    User-Agent: *
    Allow: /$
    Disallow: /

    Ez is ellentmondásos.

    3.
    Olyan megoldás hogy a disallow összes betűjét felsorolom, tehát:
    User-agent: Googlebot
    Allow: /index.html
    Disallow: /a
    /b
    /c

    Stb.

    Vélemény?



  2. #2
    Bölcs djarni logója
    Csatlakozott
    08-05-08
    Hely
    Székesfehérvár
    Hozzászólás
    5.290
    Begyűjtött 597 köszönetet
    460 hozzászólásával

    Alapbeállítás re: Robots.txt - mindent letiltanék kivéve a főoldalt, de hogyan?

    Mindenképpen tiltani akarsz? Az nem játszik, hogy minden aloldalt a főoldalra irányítasz? Csak kíváncsiságból, hátha ez nem jutott eszedbe..


    Prémium Linképítés - sikerek, kockázatok nélkül - Valódi értékek 10 éve.

  3. #3
    Mindig van lejjebb Wirg logója
    Csatlakozott
    08-06-04
    Hely
    Budapest
    Hozzászólás
    1.988
    Begyűjtött 413 köszönetet
    215 hozzászólásával

    Alapbeállítás re: Robots.txt - mindent letiltanék kivéve a főoldalt, de hogyan?

    Idézet djarni eredeti hozzászólása Hozzászólás megtekintése
    Mindenképpen tiltani akarsz? Az nem játszik, hogy minden aloldalt a főoldalra irányítasz? Csak kíváncsiságból, hátha ez nem jutott eszedbe..
    Az nem játszik, tiltani szeretnék. Ezek olyan oldalak (jó sok, kb 1M) amiknek minél előbb meg akarom szüntetni az indexelését és ennek a robotok kitiltása a legjobb módja. Ötletek?



  4. #4
    Bölcs Harder logója
    Csatlakozott
    07-05-05
    Hely
    Budapest
    Hozzászólás
    1.875
    Begyűjtött 173 köszönetet
    111 hozzászólásával

    Alapbeállítás re: Robots.txt - mindent letiltanék kivéve a főoldalt, de hogyan?

    noindex, nofollow metába, mindenhova, kivéve főoldal.



  5. #5
    Mindig van lejjebb Wirg logója
    Csatlakozott
    08-06-04
    Hely
    Budapest
    Hozzászólás
    1.988
    Begyűjtött 413 köszönetet
    215 hozzászólásával

    Alapbeállítás re: Robots.txt - mindent letiltanék kivéve a főoldalt, de hogyan?

    Idézet Harder eredeti hozzászólása Hozzászólás megtekintése
    noindex, nofollow metába, mindenhova, kivéve főoldal.
    1,5M legenerált HTML fájlról beszélünk amit nem tudok tömegesen szerkeszteni. Robots.txt tiltási megoldást keresek, más nem megy.



  6. #6
    Bölcs Harder logója
    Csatlakozott
    07-05-05
    Hely
    Budapest
    Hozzászólás
    1.875
    Begyűjtött 173 köszönetet
    111 hozzászólásával

    Alapbeállítás re: Robots.txt - mindent letiltanék kivéve a főoldalt, de hogyan?

    (Nem tudtam szerkeszteni a korábbi hozzászólásomat, úgyhogy bemásolom a módosítottat)

    noindex, nofollow metába, mindenhova, kivéve főoldal - de csak mert ez szerintem a biztosabb módszer.

    Amúgy ez szerintem a jó megoldás:

    User-agent: *
    Allow: /index.html
    Disallow: /

    A szabványkövető crawlerek esetében fontos a sorrend, ott mindig az 1. szabály az érvényes. A Google esetében ez nem így van, ugyanis az allow nyer amennyiben azonos vagy több karaktert tartalmaz, mint a disallow szabály. Szóval a "/index.html" üti ez esetben a sima "/"-t.

    Hozzáteszem gyakorlatban ilyesmit még nem próbáltam, ezért írtam elsőként a noindex, nofollow megoldást, de akkor az ezek szerint most nem opció.



  7. #7
    Mindig van lejjebb Wirg logója
    Csatlakozott
    08-06-04
    Hely
    Budapest
    Hozzászólás
    1.988
    Begyűjtött 413 köszönetet
    215 hozzászólásával

    Alapbeállítás re: Robots.txt - mindent letiltanék kivéve a főoldalt, de hogyan?

    Idézet Harder eredeti hozzászólása Hozzászólás megtekintése
    Amúgy ez szerintem a jó megoldás:

    User-agent: *
    Allow: /index.html
    Disallow: /

    A szabványkövető crawlerek esetében fontos a sorrend, ott mindig az 1. szabály az érvényes. A Google esetében ez nem így van, ugyanis az allow nyer amennyiben azonos vagy több karaktert tartalmaz, mint a disallow szabály. Szóval a "/index.html" üti ez esetben a sima "/"-t.

    Hozzáteszem gyakorlatban ilyesmit még nem próbáltam, ezért írtam elsőként a noindex, nofollow megoldást, de akkor az ezek szerint most nem opció.
    Nekem is ez a bajom, hogy nem tudom hogy hogyan reagál erre a parancsra. Hiszen ha az allow üti a disallowt akkor akár az egész 3. sort is ütheti és akkor nem ér semmit az egész Vagy ezt rosszul gondolom?



  8. #8
    Bölcs Harder logója
    Csatlakozott
    07-05-05
    Hely
    Budapest
    Hozzászólás
    1.875
    Begyűjtött 173 köszönetet
    111 hozzászólásával

    Alapbeállítás re: Robots.txt - mindent letiltanék kivéve a főoldalt, de hogyan?

    Szerintem rosszul. Az allowban meghatározott fájl nem fogja ütni a disallow-ban lévő /-t. Akkor ütné, ha az allow és a disallow is csak ennyit tartalmazna: "/".



  9. #9
    Mindig van lejjebb Wirg logója
    Csatlakozott
    08-06-04
    Hely
    Budapest
    Hozzászólás
    1.988
    Begyűjtött 413 köszönetet
    215 hozzászólásával

    Alapbeállítás re: Robots.txt - mindent letiltanék kivéve a főoldalt, de hogyan?

    Idézet Harder eredeti hozzászólása Hozzászólás megtekintése
    Szerintem rosszul. Az allowban meghatározott fájl nem fogja ütni a disallow-ban lévő /-t. Akkor ütné, ha az allow és a disallow is csak ennyit tartalmazna: "/".
    Ezer köszönet. Kipróbálom és beszámolok hogy mi lett



  10. #10
    Mindig van lejjebb Wirg logója
    Csatlakozott
    08-06-04
    Hely
    Budapest
    Hozzászólás
    1.988
    Begyűjtött 413 köszönetet
    215 hozzászólásával

    Alapbeállítás re: Robots.txt - mindent letiltanék kivéve a főoldalt, de hogyan?

    Idézet Wirg eredeti hozzászólása Hozzászólás megtekintése
    Ezer köszönet. Kipróbálom és beszámolok hogy mi lett
    Nem jó. Kipróbáltam a WMT tesztcuccal és ezt írta ki a főoldalra:
    Blokkolja a 3. sor: Disallow: /



Oldal: 1 / 2 12 UtolsóUtolsó

Könyvjelzők

Hozzászólás szabályai

  • Új témákat nem hozhatsz létre
  • Válaszokat nem küldhetsz
  • Fájlokat nem csatolhatsz
  • A hozzászólásaidat nem módosíthatod
  •  
  • BB code : engedélyezve
  • Pofik engedélyezve
  • Az [IMG] kód engedélyezve
  • [VIDEO] code is engedélyezve
  • A HTML kód kikapcsolva