Oldal: 1 / 2 12 UtolsóUtolsó
Eredmény: 1 - 10 (15) összesen

Téma: Google bot 404-et hív meg: mi a megoldás htaccess-el?

  1. #1
    Mindig van lejjebb Wirg logója
    Csatlakozott
    08-06-04
    Hely
    Budapest
    Hozzászólás
    1.985
    Begyűjtött 411 köszönetet
    213 hozzászólásával

    Alapbeállítás Google bot 404-et hív meg: mi a megoldás htaccess-el?

    Sziasztok!

    Ez egy érdekes kérdés lesz. Tehát adott egy sok tartalommal bíró, 12000 indexált oldalas lap. Szépen megy a szekér, szereti a Google is, látogatók is, stb. De jött a Google Webmaster Toolsban egy figyelmezetetés hogy gyanúsan növekszik a 404-ek száma.

    WP oldalról beszélünk és a 404-ek nagy része keresésből adódott, tehát a ?s= paramétert is tartalmazta. Ez volt még fűszerezve a domain.hu/page/ mappával, esetenként egy sokadik oldalszámmal ami nem létezett, esetleg egy submit=OK -val és még egy oldalszámmal. Nem mindig volt minden paraméter benne, csak a ?s= és a domain.hu/page/ volt a tuti, a többi ízlés szerint. Tehát olyan 404 is lehetett hogy domain.hu/page/112?s=keresoszo&submit=OK&paged=143

    A gondok ezzel:
    - Nincs /page/ a főoldalról meghívható állapotban. Tehát nem blogszerű a WP, nincsenek oldalszámozások a főoldalon. Ha valaki domain.hu/page/112-et hív meg akkor nem átirányítással, de a főoldalt látja.
    - Értelemszerűen akkor page egyedi 112 sincs, lásd fenti URL
    - Keresődoboz ugyan van, de az ilyet generál: domain.hu/?s=keresoszo&x=0&y=0 - ez egy spéci WP kereső plugin
    - Ennek megfelelően nincs submit=OK sem, nincs olyan felület amin ezt meg lehetne hívni. Hogyan lett meghívva?
    - Továbbá nincs olyan keresőszó amire paged=143 lehetne
    - Értelemszerűen nincsenek ilyesmi hivatkozások linkelve az oldalon

    Na mondom jól van, nézem mi a gond. Sitemap oké, nincs benne semmi sz@r. Nem is dinamikus, szóval no para. Nézem az adatbázist, ekkor már fórumtárs segítségével, ebben látszik hogy a Google bot hívja meg ezeket. Na mondom remek, éhes a robot.

    A történethez hozzátartozik hogy a Google a site:domain.hu/page/ keresésre kiadott 163 találatot. Köztük ilyet:
    domai.hu/page/9?s=ékezetes+keresőszó&submit=OK&paged=1 - és ez egy működő aloldal volt. Nyilván az alacsony page/9 miatt, ami mégsem page/112 és volt ilyen találat. De se sitemapben, se linkelve, se semmi.

    Jelenleg arra gondolok hogy egyrészt ez így nem egészséges, másrészt túl sok a 404 ahhoz a kevés jó találathoz képest. Tehát a domain.hu/page/ dologgal kezdődő találatokat szívem szerint htaccessben főoldalra irányítanám.

    Ehhez kérnék megoldást illetve az egész jelenséghez alternatív megoldást, véleményt, ötletet, stb.

    Azzal tisztában vagyok hogy egy ideig nagyon népszerűek voltak az olyan pluginok amelyek kereséseket indexáltak. Ott direkt az volt a cél. Itt ez egyáltalán nem cél, mert a francnak kell a sok 404.



  2. #2
    Bölcs benedictus logója
    Csatlakozott
    10-04-23
    Hozzászólás
    1.574
    Begyűjtött 2 köszönetet
    2 hozzászólásával

    Alapbeállítás re: Google bot 404-et hív meg: mi a megoldás htaccess-el?

    RewriteRule page/ / [R=301]

    (esetleg robots.txt)



  3. #3
    Mindig van lejjebb Wirg logója
    Csatlakozott
    08-06-04
    Hely
    Budapest
    Hozzászólás
    1.985
    Begyűjtött 411 köszönetet
    213 hozzászólásával

    Alapbeállítás re: Google bot 404-et hív meg: mi a megoldás htaccess-el?

    Ismerem a 301-et. Jól akarom paraméterezni a dolgot, tehát azt akarom hogy minden domain.hu/page/ -es cucc ezentől a domain.hu -ra irányuljon. Ehhez mi a pontos kód?

    Robots txt-nél a domain.hu/page/ mappát kell letiltanom? Ott mi a pontos kód?

    Idézet benedictus eredeti hozzászólása Hozzászólás megtekintése
    RewriteRule page/ / [R=301]

    (esetleg robots.txt)




  4. #4
    Bölcs benedictus logója
    Csatlakozott
    10-04-23
    Hozzászólás
    1.574
    Begyűjtött 2 köszönetet
    2 hozzászólásával

    Alapbeállítás re: Google bot 404-et hív meg: mi a megoldás htaccess-el?

    robóc.txt
    Kód:
    User-agent: *
    Disallow: /page/
    .htaccess
    Kód:
    ...
    
    RewriteRule ^page/ / [R=301,L]
    
    # BEGIN WORDPRESS ...




  5. #5
    Bölcs djarni logója
    Csatlakozott
    08-05-08
    Hely
    Székesfehérvár
    Hozzászólás
    5.177
    Begyűjtött 558 köszönetet
    427 hozzászólásával

    Alapbeállítás re: Google bot 404-et hív meg: mi a megoldás htaccess-el?

    Ezek a keresések linkelve voltak az oldalon? Vagy egy árva linket nem generáltál, maga a googlebot mászott bele a keresésbe?

    Ez utóbbi tényleg érdekes, ha linkelted, akkor pedig világos, hogy leindexeli.

    Ha megfelelő az átirányítás, akkor nem kell a robots.txt-t használni, mert a 301 miatt idővel kiveszi az indexből a szemetet. Ha nem veszi ki, akkor is tudja, hogy ott 301 van, ami teljesen seo barát.

    Én így irányítanám át, de nem biztos, hogy működik, egy htaccess szakértő is hagyja jóvá, mielőtt használod:

    Kód:
    RewriteRule ^/?page/(.+)$ / [R=301,L]
    RewriteRule ^/?page/ / [R=301,L]
    Arni



  6. #6
    Mindig van lejjebb Wirg logója
    Csatlakozott
    08-06-04
    Hely
    Budapest
    Hozzászólás
    1.985
    Begyűjtött 411 köszönetet
    213 hozzászólásával

    Alapbeállítás re: Google bot 404-et hív meg: mi a megoldás htaccess-el?

    Idézet benedictus eredeti hozzászólása Hozzászólás megtekintése
    robóc.txt
    Kód:
    User-agent: *
    Disallow: /page/
    .htaccess
    Kód:
    ...
    
    RewriteRule ^page/ / [R=301,L]
    
    # BEGIN WORDPRESS ...
    És ez nem fogja megváltoztatni azt is ha az oldalon máshol is van /page/ de ott jól működik? Tehát mondjuk domain.hu/kategoria/page/2? Ez elvileg egy jó URL és nem szeretném ha kivágná. Lsz mondjatok erre valamit. Olyan megoldás kellene ami csak a domain.hu/page/ mappára vonatkozik és máshol nem kavar be a /page/ nek, hiszen akkor a kategória vagy címke lapozóoldalát is bántaná. Ötletek?


    Utoljára módosítva: Wirg által : 2012-07-23 20:33

  7. #7
    Bölcs benedictus logója
    Csatlakozott
    10-04-23
    Hozzászólás
    1.574
    Begyűjtött 2 köszönetet
    2 hozzászólásával

    Alapbeállítás re: Google bot 404-et hív meg: mi a megoldás htaccess-el?

    Csak a főoldalit irányítja át, ahogy akartad!



  8. #8
    Mindig van lejjebb Wirg logója
    Csatlakozott
    08-06-04
    Hely
    Budapest
    Hozzászólás
    1.985
    Begyűjtött 411 köszönetet
    213 hozzászólásával

    Alapbeállítás re: Google bot 404-et hív meg: mi a megoldás htaccess-el?

    Köszönöm a segítséget, a probléma megoldódott az egyik javasolt scripttel. Szerintem hagyjuk nyitva a topikot, mert másnak is lehet ilyen baja. A lényeg egy search plugin volt, amit a G elkezdett bombázni fals lekérésekkel.



  9. #9
    Bölcs Nero logója
    Csatlakozott
    08-10-16
    Hely
    határ
    Hozzászólás
    810
    Begyűjtött 23 köszönetet
    18 hozzászólásával

    Alapbeállítás re: Google bot 404-et hív meg: mi a megoldás htaccess-el?

    pontosan mivel oldattad meg? milyen scriptel?



  10. #10
    Mindig van lejjebb Wirg logója
    Csatlakozott
    08-06-04
    Hely
    Budapest
    Hozzászólás
    1.985
    Begyűjtött 411 köszönetet
    213 hozzászólásával

    Alapbeállítás re: Google bot 404-et hív meg: mi a megoldás htaccess-el?

    Header.php -ba kellett rakni és az a lényege hogy az adott paraméterezésen belül megkeresi és átirányítja az adott kategórián/címkén belüli első valid oldalra.
    Idézet Nero eredeti hozzászólása Hozzászólás megtekintése
    pontosan mivel oldattad meg? milyen scriptel?




Oldal: 1 / 2 12 UtolsóUtolsó

Könyvjelzők

Hozzászólás szabályai

  • Új témákat nem hozhatsz létre
  • Válaszokat nem küldhetsz
  • Fájlokat nem csatolhatsz
  • A hozzászólásaidat nem módosíthatod
  •