Oldal: 1 / 2 12 UtolsóUtolsó
Eredmény: 1 - 10 (13) összesen

Téma: Az ékezetes linkek eltérő kódolása okozhat duplikált tartalom problémát?

  1. #1
    Bölcs
    Csatlakozott
    08-10-05
    Hozzászólás
    1.162
    Begyűjtött 147 köszönetet
    118 hozzászólásával

    Alapbeállítás Az ékezetes linkek eltérő kódolása okozhat duplikált tartalom problémát?

    Pl. a link egyik paraméterében ékezetes szó van, és kétfajta link lehet ugyanarra az oldalra:

    hxxp://oldal.hu/item.php?item=kab%C3%A1t

    vs

    hxxp://oldal.hu/item.php?item=kabát


    Ugye a Google meg a többi van olyan intelligens, hogy ilyen kódolási problémákon átlát, és nem gondolja, hogy ez két különböző oldal azonos tartalommal, vagyis ezeket a linkeket nem kell kanonizálni?

    Felteszem nem kell, de gondoltam azért megkérdezem az értőket.



  2. #2
    'Say Hello To My Little Friend'
    Csatlakozott
    10-04-13
    Hely
    Budapest
    Hozzászólás
    2.784
    Begyűjtött 863 köszönetet
    659 hozzászólásával

    Alapbeállítás re: Az ékezetes linkek eltérő kódolása okozhat duplikált tartalom problémát?

    Ez a kettő egy és ugyan az, nincs közte különbség. Próbáld meg az ékezet nélkülit megnyitni böngészőben, láthatod, hogy automatikusan átírja az ékezetesre. Mert ez nem két külön URL, hanem egy és ugyan azon URL két különböző leírása.



  3. #3
    Bölcs Baross Ferenc logója
    Csatlakozott
    09-04-06
    Hely
    Budapest
    Hozzászólás
    2.208
    Begyűjtött 844 köszönetet
    573 hozzászólásával

    Alapbeállítás re: Az ékezetes linkek eltérő kódolása okozhat duplikált tartalom problémát?

    Ha canonical url-t megadsz, akkor még az elméleti esélye se lesz meg annak h félreérti a Google.



  4. #4
    Bölcs
    Csatlakozott
    08-10-05
    Hozzászólás
    1.162
    Begyűjtött 147 köszönetet
    118 hozzászólásával

    Alapbeállítás re: Az ékezetes linkek eltérő kódolása okozhat duplikált tartalom problémát?

    OK, akkor az a kérdés, hogy érdemes-e egyáltalán ezeket a linkeket encode-olni, vagy simán mehet úgy is az oldal kódjában, hogy:

    hxxp://oldal.hu/item.php?item=kabát


    Mintha régen lett volna probléma azzal, ha így szerepeltek a linkek a kódban, de lehet, hogy valami régen meghaladott probléma rémlik csak.



  5. #5
    'Say Hello To My Little Friend'
    Csatlakozott
    10-04-13
    Hely
    Budapest
    Hozzászólás
    2.784
    Begyűjtött 863 köszönetet
    659 hozzászólásával

    Alapbeállítás re: Az ékezetes linkek eltérő kódolása okozhat duplikált tartalom problémát?

    Simán mehet ékezetesen, ha bármelyik böngésző évek óta kezeli, meglepődnék, ha bárhol bármilyen gond lenne belőle.



  6. #6
    Bölcs
    Csatlakozott
    08-10-05
    Hozzászólás
    1.162
    Begyűjtött 147 köszönetet
    118 hozzászólásával

    Alapbeállítás re: Az ékezetes linkek eltérő kódolása okozhat duplikált tartalom problémát?

    Megnéztem az RFC-t, és a hivatalos direktíva az, hogy minden, ami nem US-ASCII karater, azt %-os kódolással kell írni:

    RFC 3986 - Uniform Resource Identifier (URI): Generic Syntax

    Persze a böngészők sok mindenben megengedőbbek.



  7. #7
    'Say Hello To My Little Friend'
    Csatlakozott
    10-04-13
    Hely
    Budapest
    Hozzászólás
    2.784
    Begyűjtött 863 köszönetet
    659 hozzászólásával

    Alapbeállítás re: Az ékezetes linkek eltérő kódolása okozhat duplikált tartalom problémát?

    Idézet spontan eredeti hozzászólása Hozzászólás megtekintése
    Megnéztem az RFC-t, és a hivatalos direktíva az, hogy minden, ami nem US-ASCII karater, azt %-os kódolással kell írni:

    RFC 3986 - Uniform Resource Identifier (URI): Generic Syntax

    Persze a böngészők sok mindenben megengedőbbek.
    Szerintem pedig pont írja a specifikáció, hogy a protokoll által van definiálva a karakterkódolás, ami jelen esetben gyakorlatilag a weboldalad karakterkódolásával egyenlő. Tehát ha a weboldalad ASCII-ban van kódolva (erősen meglepődnék), akkor kell csak abban kódolni az url-t is. Ha a weboldalad pl. utf-8, akkor abban kell kódolni az url-t is. Ez a logikus is, hisz te megadod, hogy milyen karakterkódolással értelmezze a kapott adatokat, és le tudja mappelni.


    Utoljára módosítva: Emphus által : 2015-10-26 20:11

  8. #8
    Bölcs
    Csatlakozott
    08-10-05
    Hozzászólás
    1.162
    Begyűjtött 147 köszönetet
    118 hozzászólásával

    Alapbeállítás re: Az ékezetes linkek eltérő kódolása okozhat duplikált tartalom problémát?

    Idézet Emphus eredeti hozzászólása Hozzászólás megtekintése
    Szerintem pedig pont írja a specifikáció, hogy a protokoll által van definiálva a karakterkódolás
    Ez azt jelenti, hogy a szabvány nem specifikálja azt, hogy hogyan kell neked us-ascii-ba lekódolni, tehát azt nem mondja meg, hogy az á az a %C3%A1 legyen, elvben másképp is le lehetne kódolni. De az, hogy az alap karakterkészlet us-ascii legyen, azt előírja:

    The ABNF notation defines its terminal values to be non-negative integers (codepoints) based on the US-ASCII coded character set




  9. #9
    'Say Hello To My Little Friend'
    Csatlakozott
    10-04-13
    Hely
    Budapest
    Hozzászólás
    2.784
    Begyűjtött 863 köszönetet
    659 hozzászólásával

    Alapbeállítás re: Az ékezetes linkek eltérő kódolása okozhat duplikált tartalom problémát?

    Idézet spontan eredeti hozzászólása Hozzászólás megtekintése
    Ez azt jelenti, hogy a szabvány nem specifikálja azt, hogy hogyan kell neked us-ascii-ba lekódolni, tehát azt nem mondja meg, hogy az á az a %C3%A1 legyen, elvben másképp is le lehetne kódolni. De az, hogy az alap karakterkészlet us-ascii legyen, azt előírja:
    De a terminal values az az, amit majd csinál neked a böngésző, nem az, amit a kódba beírsz. Ha van egy utf8 oldalad, abba utf8-kéne rakod a linket, amire ha kattintasz, a böngésző (és minden értelmes robot) pedig utf8-ból lemappeli neked ascii-ra, és végül abban megy a kérés. De a html kódba te utf8-ként rakod be a linket, nem ascii kódolásban (mert amit te leírsz a html-be az nonterminal érték. Az egész uri egy formális nyelv alapján változik, a link amire kattint valaki nonterminal értéket tartalmaz, ami a formális nyelv egyes szabályai alapján a böngésző vagy egyéb szolgáltatás terminal értékké alakít, és ez kerül be végül a csomagba.)

    Igazából full mindegy melyiket írod, a kabát szó olvashatóbb mint a kab%C3%A1t, és szerintem a userek is szívesebben linkelik vagy kattintnak olyan linkre, ahol érdemben el udják olvasni milyen url-re érkeznek.



  10. #10
    Bölcs earnnet logója
    Csatlakozott
    12-08-15
    Hely
    Budapest
    Hozzászólás
    1.815
    Begyűjtött 804 köszönetet
    572 hozzászólásával

    Alapbeállítás re: Az ékezetes linkek eltérő kódolása okozhat duplikált tartalom problémát?

    Volt ebből régebben problémám, bizonyos más oldalakon (asszem a facebook og debug tool is ilyen) nem fogadja el az ékezetes URL-t, és onnantól kezdve lemaradsz egy csomó dologról. Lehet, hogy mondjuk valaki megosztaná redditen az oldalad, de pont az ékezet miatt nem lesz jó a link. És így tovább.

    Az urlencoded form csak javaslat és nem szabvány. A domain internatinalizationnel elég sok verzió bejött és a böngészők támogatása is kiterjedt az UTF8 jórészére (null byteot vagy RTL karaktert továbbra se akarj írni bele, de egy ű betű a legtermészetesebb dolog). Ennek ellenére a fenti problematika miatt nem ajánlom.



Oldal: 1 / 2 12 UtolsóUtolsó

Könyvjelzők

Hozzászólás szabályai

  • Új témákat nem hozhatsz létre
  • Válaszokat nem küldhetsz
  • Fájlokat nem csatolhatsz
  • A hozzászólásaidat nem módosíthatod
  •