ganzen Satz im String

  • ich habe mal ein Script geschrieben was den ganzen Server durchsucht hat und sämtliche informationen ,wie zeilen wörter aktualiesirungs datum und kompletten Quelltext in der db gespeichert hat.


    Deswegen findet er nätürlich jetzt alles auch html oder script datein.

    Für eine suche ( Meine suche ) ist es natürlich gut weil ich ja ungefähr weiß wie wo was ich geschrieben habe ,und somit alles besser finde.


    Für eine Besucher suche muß ich natürlich eine eigene Datanbank erstellen die nur <h1>-h6 ,p,li datein findet ,zumindest das was drinne steht und sämlichen Code außen vor lassen.


    Sagen wir mal das die DB jetzt stehen würde ,könnte man mit LEVENSHTEIN('basti' , 'inhalt') die Datenbank durchsuchen und Wörter wie hasti finden ?

    Oder muß man dafür viell mehr ändern ,bzw was ganz anderes schreiben.

    Der Link von eben konnte mir da nicht weiterhelfen un dein Script habe ich noch nicht ganz verstanden und somit natürlich noch keine idee wie ich das mit reinschreibe.


    Aber da du gerade ja sagtest das dein Script nur html datein findet ,weis ich gar nicht wie das läuft weil im DB ja der komplette quelltext eingescannt wurde.


    Wie gesagt das hatte ich mal für mich gemacht und sollte auch keine suche für alle sein .

    Die suche für alle soll natürlich ohne quelltext datein laufen ,also das was man sehen kann

  • Grundsätzlich kannst Du mit levenshtein nur Phrasen vergleichen, wobei bei Deinem Vorhaben eigentlich nur Worte in Frage kommen. D willst ja auch ähnliche Worte finden. Man müsste mal testen, was performanter ist, MySQL oder der Umweg über PHP. Kostenintensiv ist levenshtein immer, also ein performante Lösung wirst Du nicht finden für Dein Vorhaben.


    Datenbankseitig läuft das aber ziemlich genau so. Du musst Dir die Texte in Worte runtergebrochen hernehmen und vergleichen.

  • Sehe ich das richtig ?

    Also ich lasse meine Db einen ganz norrmalen eintrag ausgebn.

    Bevor es aber im echo oder sonst wie ausgegeben wird teste ich den ganzen "INHALT" aus das wort "BASTI".

    Findet er nix ,gibt es kein echo fertif.

    Findet er dann durch levenshtein() dann "HASTI" oder BASTO" lasse ich es so ausgeben wie immer ( so wie das ganze Thema drüber geredet wurde )


    Da levenshtein() ja nur vergleichen tut und eine Prozenzahl oder ähnliches ausgibt müsste man ja jedes Wort von "INHALT" durch eine schleife laufen lassen und vergleichen .Sobald ein Wort uber zb 80% kommt gebe ich es als ähnliches Wort aus und makiere es wie gehabt.??


    Meine Db umfasst ja nur ca 1000 datein.Nur frage ich mich wie lange so eine suche dauern kann ? So eine Datenbank suchen ohne extra dauert bei millionen Einträgen nur wennige ,bzw mal eine Sekunde.

    Nur wenn man jetzt über jede Ausgabe ( INHALT) noch eine extra abfrage levenshtein() über der Ausgabe laufen läst ,ob das dann noch alles funktioniert.


    Wie würdest du den ein Script über INHALT laufen lassen ??

    erst INHALT einlesen und dann mit wort.length jedes Wort auslesen und dann mit levenshtein() vergleichen ?? Wenn treffer über 80 % dann ok ,dann kommt ein eintrag im echo ?

  • Ich habe das Gefühl, dass Du die Antworten gar nicht richtig liest!

    Dass Du den Text, also Deinen INHALT auf jedes Wort runterbrechen musst, um sinnvoll mit levenshtein vergleichen zu können.

    Wenn man die Doku genau betrachtet, ist das auch nur logisch. In #48 habe ich das bereits das erste mal auch erwähnt.


    Ob das ganze von der Performance her am Ende noch ertragbar ist, musst Du testen, das kann man unmöglich vorhersagen. Inperformant ist es allemal, aber wie sehr, steht in den Sternen. Evtl. reicht es für Dein Vorhaben.

  • warum muß immer alles hinterfragt werden ? Das hat mit meine lese und rechschreibschwäche nich zu tun( Tut mir leid konnte in 5 Jahren nicht mehr Deutsch lernen ).


    Also bleibt nur noch eins übrig und zwar ob es geht und wie .

    Wieso und weshalb kann euch doch egal sein ,

    Wenn ich basti eintippe soll er spasti finden oder hasti , oder basti ist zu blöd in 5 jahren deutsch zu lernen und soll wieder auswandern

  • Nu lass doch mal gut sein. Warum wieso weshalb er das so machen will, ist seine Sache, ob es uns das gefällt oder nicht.

    Dennoch ist das Thema spannend und hilft evtl. anderen, die bei Ihrer Suche auf diesen Thread stolpern und das sinnvoll verwenden können.

    Da schon mal dran gedacht?