Mailing List Archive

TextIndexNG3 Problem: Links werden nicht indexiert
Hallo zusammen,
ich hab zope 2.12.17 und möchte gerne den TextIndexNG3 nutzen. Eigentlich klappt
alles prima. Aber nun fällt mir auf, daß Einträge nicht mehr angezeigt werden,
die mit dem ZCTextIndex noch gefunden worden sind. Wenn ich die Catalogeinträge
mit denen des ZCTextindex vergleiche, fällt mir auf, daß der TextIndexNG3 nicht
alles erfasst:

Beispiel: Suchbegriff 'his-hf'

Eintrag ZCTextIndex:
['his', 'hf', 'logo', 'farbig', 'mit', 'text', ...]

TextIndexNG3:
{'PrincipiaSearchSource': [u'dtml-var', u'standardhtmlheader', u'h2dtml-var',
..... u'classsmallhis-hf', u'logo', u'farbig', u'mit', u'textbr' ...}

Der TextIndexNG3 nimmt auch sämtliche HTML-und dtml-Elemente auf, was dazu
führt, daß das DTML-Dokument bei Eingabe des Suchbegriffs "his-hf" nicht
gefunden wird, weil er das 'Wort' 'classsmallhis-hf' indexiert hat. ich könnt
jetzt natürlich mit *his-hf* suchen, aber damit würde ich ja (bei anderen
Suchbegriffen) viel Mist angezeigt bekommen...

Kann ich an den TextIndexNG3-Parametern noch etwas schrauben, damit auch
DTML-Dokumente erfasst werden, in denen der Suchbegriff "nur" als Link vorkommt?

Danke für Eure Hilfe und schöne Grüße aus Hannover,
Ruth Cordes

_______________________________________________
Zope maillist - Zope@zope.org
https://mail.zope.org/mailman/listinfo/zope
** No cross posts or HTML encoding! **
(Related lists -
https://mail.zope.org/mailman/listinfo/zope-announce
https://mail.zope.org/mailman/listinfo/zope-dev )
Re: TextIndexNG3 Problem: Links werden nicht indexiert [ In reply to ]
First: stay in English
Second: looks as if you are somehow indexing the unrendered DTML source
code...somehow....no idea how to fix this since DTML is obsolete and because
I don't care about DTML. You may take the debugger in order to figure out
why unrendered DTML source code makes it into the indexer (instead of the rendered
HTML).

-aj

Ruth Cordes wrote:
> Hallo zusammen,
> ich hab zope 2.12.17 und möchte gerne den TextIndexNG3 nutzen. Eigentlich klappt
> alles prima. Aber nun fällt mir auf, daß Einträge nicht mehr angezeigt werden,
> die mit dem ZCTextIndex noch gefunden worden sind. Wenn ich die Catalogeinträge
> mit denen des ZCTextindex vergleiche, fällt mir auf, daß der TextIndexNG3 nicht
> alles erfasst:
>
> Beispiel: Suchbegriff 'his-hf'
>
> Eintrag ZCTextIndex:
> ['his', 'hf', 'logo', 'farbig', 'mit', 'text', ...]
>
> TextIndexNG3:
> {'PrincipiaSearchSource': [u'dtml-var', u'standardhtmlheader', u'h2dtml-var',
> ..... u'classsmallhis-hf', u'logo', u'farbig', u'mit', u'textbr' ...}
>
> Der TextIndexNG3 nimmt auch sämtliche HTML-und dtml-Elemente auf, was dazu
> führt, daß das DTML-Dokument bei Eingabe des Suchbegriffs "his-hf" nicht
> gefunden wird, weil er das 'Wort' 'classsmallhis-hf' indexiert hat. ich könnt
> jetzt natürlich mit *his-hf* suchen, aber damit würde ich ja (bei anderen
> Suchbegriffen) viel Mist angezeigt bekommen...
>
> Kann ich an den TextIndexNG3-Parametern noch etwas schrauben, damit auch
> DTML-Dokumente erfasst werden, in denen der Suchbegriff "nur" als Link vorkommt?
>
> Danke für Eure Hilfe und schöne Grüße aus Hannover,
> Ruth Cordes
>
> _______________________________________________
> Zope maillist - Zope@zope.org
> https://mail.zope.org/mailman/listinfo/zope
> ** No cross posts or HTML encoding! **
> (Related lists -
> https://mail.zope.org/mailman/listinfo/zope-announce
> https://mail.zope.org/mailman/listinfo/zope-dev )
Re: TextIndexNG3 Problem: Links werden nicht indexiert [ In reply to ]
Hi Andreas,

the company I work for uses zope for about 10 years.
I work with it for 3 years now. Most of the code is dtml and the web-projects
are quite complex so it's not trivial to change it all to lets say
page-templates. So I have to live with it.
Still we would like to use TextIndexNG3, in order to index pdf-files. I tried
the debug-mode but I didn't get any errors.
I also changed txng.splitters.simple
to txng.splitters.default.
This divides the pure text ('his-hf') from html
('classsmallhis-hf'). Still dtml is not rendered.

Can you give any hint, where
the rendering should take place (in which .py-file, that is)?
It's strange that dtml is rendered correctly in ZCTextIndex.

Thanks in advance!
Ruth

_______________________________________________
Zope maillist - Zope@zope.org
https://mail.zope.org/mailman/listinfo/zope
** No cross posts or HTML encoding! **
(Related lists -
https://mail.zope.org/mailman/listinfo/zope-announce
https://mail.zope.org/mailman/listinfo/zope-dev )
Re: TextIndexNG3 Problem: Links werden nicht indexiert [ In reply to ]
Hi Andreas,
I just tried to index a zope page template object with TextIndexNG3 and noticed
that the HTML also wasn't rendered, just like it was with dtml. Strange. Perhaps
there is something wrong with my zope-instance? Or could it be that the
TextIndexNG3-Products I use don't go together well? It's
Products.TextIndexNG3-3.4.5.1-py2.6.egg, zopyx.txng3.core-3.5.3-py2.6.egg and
zopyx.txng3.ext-3.3.2-py2.6-linux-i686.egg. I also found two older versions:
zopyx.textindexng3-4.0.1-py2.6-linux-i686.egg and
Products.TextIndexNG3-3.4.1-py2.6.egg in the "eggs"-folder. Might that cause the
trouble?
Greetings, Ruth

_______________________________________________
Zope maillist - Zope@zope.org
https://mail.zope.org/mailman/listinfo/zope
** No cross posts or HTML encoding! **
(Related lists -
https://mail.zope.org/mailman/listinfo/zope-announce
https://mail.zope.org/mailman/listinfo/zope-dev )
Re: TextIndexNG3 Problem: Links werden nicht indexiert [ In reply to ]
On 05.11.2012, at 09:06, Ruth Cordes wrote:
> Hi Andreas,
> I just tried to index a zope page template object with TextIndexNG3 and noticed
> that the HTML also wasn't rendered, just like it was with dtml. Strange. Perhaps
> there is something wrong with my zope-instance? Or could it be that the
> TextIndexNG3-Products I use don't go together well? It's
> Products.TextIndexNG3-3.4.5.1-py2.6.egg, zopyx.txng3.core-3.5.3-py2.6.egg and
> zopyx.txng3.ext-3.3.2-py2.6-linux-i686.egg. I also found two older versions:
> zopyx.textindexng3-4.0.1-py2.6-linux-i686.egg and
> Products.TextIndexNG3-3.4.1-py2.6.egg in the "eggs"-folder. Might that cause the
> trouble?
> Greetings, Ruth

The section "How to make your custom content-types searchable" [1] indicates you have to provide an IIndexableContent adapter for the types you want indexed (i.e. DMTLDocument).

Cheers,
Stefan

[1] http://pypi.python.org/pypi/Products.TextIndexNG3

--
Stefan H. Holek
stefan@epy.co.at

_______________________________________________
Zope maillist - Zope@zope.org
https://mail.zope.org/mailman/listinfo/zope
** No cross posts or HTML encoding! **
(Related lists -
https://mail.zope.org/mailman/listinfo/zope-announce
https://mail.zope.org/mailman/listinfo/zope-dev )