Eredmény: 1 - 4 (4) összesen

Téma: TF-IDF kivesézése

  1. #1
    Seo-Titán hunprobalazs logója
    Csatlakozott
    10-05-30
    Hely
    Sin City
    Hozzászólás
    2.177
    Begyűjtött 381 köszönetet
    269 hozzászólásával

    Alapbeállítás TF-IDF kivesézése

    Jól érzem, hogy erről a Google-féle jelzőről nem nagyon esett szó itt a fórum berkein belül? Valahogy mindenki átsiklott fölötte?

    Aki nem tudná mit takar ez, annak egy kis ismertetés:
    Ez a jelző egy szó fontosságát jelenti egy oldalon belül. Ez a fontosság nő a szónak a gyakori használatával, viszont csökken, ha az adott weblapon egyre több helyen jelenik meg.

    Bennem most ez kérdéseket vetett fel. Például ha van egy olyan oldal, ami a kutyákkal foglalkozik, a főoldalát optimalizáljuk a kutya szóra, majd ha újabb long tail-ek miatt újabb aloldalakat nyitunk, melyben a kutya szó is szerepel, akkor a főoldal gyengül erre a kulcsszóra?

    Vagy hogy van akkor most ez? Magyar irodalma nem igen van, angolban azért lényegesen több, pl.:
    TF-IDF Wikipedia

    tf–idf, short for term frequency–inverse document frequency, is a numerical statistic that is intended to reflect how important a word is to a document in a collection or corpus.[1]:8 It is often used as a weighting factor in information retrieval and text mining. The tf-idf value increases proportionally to the number of times a word appears in the document, but is offset by the frequency of the word in the corpus, which helps to control for the fact that some words are generally more common than others.

    Variations of the tf–idf weighting scheme are often used by search engines as a central tool in scoring and ranking a document's relevance given a user query. tf–idf can be successfully used for stop-words filtering in various subject fields including text summarization and classification.

    One of the simplest ranking functions is computed by summing the tf–idf for each query term; many more sophisticated ranking functions are variants of this simple model.




  2. #2
    Bölcs BoGyesz logója
    Csatlakozott
    07-09-17
    Hely
    Sydney
    Hozzászólás
    1.067
    Begyűjtött 435 köszönetet
    198 hozzászólásával

    Alapbeállítás re: TF-IDF kivesézése

    Múlt héten volt erről is szó a Moz cikkében: More than Keywords: 7 Concepts of Advanced On-Page SEO - Moz

    Igazából nem kell túlmisztifikálni a dolgot, mert egy jó szövegíró munkája eleve ilyen, viszont egy spin article vagy egy gagyi textbroker cikk könnyen felakadhat ezen a szűrőn meg nem használ olyan szavakat és kifejezéseket, amiket elismert oldalakon publikált cikkek használnak.

    A Moz cikk is azt írja, hogy nem érdemes csak erre koncentrálni, mert ez csak egy a sok "minőség mérőből" és jó szövegíróknak ez természetes.


    "Rank Doesn’t Matter, Conversion Does"

  3. Az alábbi felhasználók hálásak a válaszért:

    hunprobalazs (2014-10-31)

  4. #3
    Bölcs esotanc logója
    Csatlakozott
    11-02-08
    Hely
    Törökszentmiklós
    Hozzászólás
    2.000
    Begyűjtött 1.245 köszönetet
    640 hozzászólásával

    Alapbeállítás re: TF-IDF kivesézése

    Balázs, amit írsz az csak akkor igaz, ha az IDF az adott domainen belüli dokumentumokból számítódik, ha a web egészére vonatkozik, akkor nem.
    Példa:
    keresési kifejezés: "Hyperion költő"
    A dokumentum szövege: " John Keats a Hyperion megalkotója méltán lett világhírű"
    B dokumentm szövege: "A költők költője John Keats az angol irodalom büszkesége"

    Mivel a Hyperion sokkal kevésbé általános kifejezés, mint a költő, ezért az A dokumentum fog kijönni első helyen az adott keresésre a TF*IDF értékek alapján.
    Nem tudom érthető-e, amit írtam?



  5. Az alábbi felhasználók hálásak a válaszért:

    hunprobalazs (2014-10-31)

  6. #4
    Bölcs irokob logója
    Csatlakozott
    11-03-23
    Hely
    Far Far Away
    Hozzászólás
    504
    Begyűjtött 113 köszönetet
    96 hozzászólásával

    Alapbeállítás re: TF-IDF kivesézése

    Ismer valaki olyan ingyenes TF-IDF elemző eszközt, ami a magyar nyelvvel is elboldogul? Vagy hasonló, szövegíráshoz használható eszközt? Jó lenne egy témában minden lényeges szót automata módon összegyűjteni.


    Az élet nem habos torta - A medve nem játék

Könyvjelzők

Hozzászólás szabályai

  • Új témákat nem hozhatsz létre
  • Válaszokat nem küldhetsz
  • Fájlokat nem csatolhatsz
  • A hozzászólásaidat nem módosíthatod
  •