<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>TYPO3 Blog - für TYPO3 Entwickler von TYPO3 Experten &#187; Zend</title>
	<atom:link href="http://blog.marit.ag/tag/zend/feed/" rel="self" type="application/rss+xml" />
	<link>http://blog.marit.ag</link>
	<description>TYPO3 Entwicklung, TYPO3 Extensions, TypoScript, TYPO3 Installation und vieles mehr</description>
	<lastBuildDate>Fri, 27 Jan 2012 10:30:19 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>TYPO3 und die Lucene Suche von Zend</title>
		<link>http://blog.marit.ag/2008/09/09/typo3-und-die-lucene-suche-von-zend/</link>
		<comments>http://blog.marit.ag/2008/09/09/typo3-und-die-lucene-suche-von-zend/#comments</comments>
		<pubDate>Tue, 09 Sep 2008 17:08:54 +0000</pubDate>
		<dc:creator>Michael</dc:creator>
				<category><![CDATA[TYPO3 Technik]]></category>
		<category><![CDATA[lucene]]></category>
		<category><![CDATA[search]]></category>
		<category><![CDATA[Zend]]></category>

		<guid isPermaLink="false">http://blog.marit.ag/?p=162</guid>
		<description><![CDATA[Ich habe heute abend mal vesucht, den quasi Ersatz der Indexed_search, die powersearchlucene zu installieren und habe recht gute Resultate zu vermelden. Wir haben die Powerseach noch um eine Idee erweitert, um die Vollindizierung aller Seiten indexed_search-like hinzubekommen: Zu allererst muss man 4 Extensions installieren: Paket aller benötigten (angepassten) Extensions für die Lucene-Suche powersearch (Basic [...]]]></description>
			<content:encoded><![CDATA[<p>Ich habe heute abend mal vesucht, den quasi Ersatz der Indexed_search, die powersearchlucene zu installieren und habe recht gute Resultate zu vermelden. Wir haben die Powerseach noch um eine Idee erweitert, um die Vollindizierung aller Seiten indexed_search-like hinzubekommen:</p>
<p><span id="more-162"></span></p>
<p>Zu allererst muss man 4 Extensions installieren:</p>
<p><a href="http://blog.marit.ag/wp-content/uploads/lucene-extensions.zip">Paket aller benötigten (angepassten) Extensions für die Lucene-Suche<br />
</a></p>
<p><strong>powersearch (Basic Extension)</strong><br />
<strong> powersearchui (Frontend Plugin)</strong><br />
Das Plugin kann gleich auf einer Seite eingefügt werden, wird aber momentan noch nicht funktionieren.</p>
<p><strong>weear_googlesitemap (Zusammenfassung aller Seiten)</strong><br />
Die Google-Sitemap muss laut manual installiert werden. Das ist recht einfach. Hier muss darauf geachtet werden, dass auch News-Seiten und dergleichen in der Google-Sitemap auftauchen.</p>
<p><strong> powersearchindexlucene (CLI-Indexer)</strong><br />
Der Indexer benötigt ein paar Einstellungen, die während der Installation gemacht werden müssen:<br />
- Absoluter Pfad zur Google-Sitemap<br />
- Used Indexers: hier können die Verschiedenen zur Auswahl stehenden Index-Typen eingestellt werden</p>
<p><strong>T3Content</strong>: Indiziert nur tt_content, in unserem Fall nicht brauchbar<br />
<strong>T3Dam</strong>: Indiziert alle DAM-Files, sehr praktisch, wenn alle Files im DAM öffentlich sein sollen<br />
<strong>T3Files</strong>: Alternativlösung zu DAM, indiziert alle Dateien, die auf einer Seite oder einem Inhalt eingebunden sind.<br />
<strong>NewsML</strong>: Indizierung der Tabelle nml_articlerev, in den meisten Fällen unbrauchbar<br />
<strong>Files</strong>: Indiziert alle Dateien unterhalb des fileadmin-Verzeichnisses<br />
<strong>Googlesitemap</strong>: Unsere gloriose Weiterentwicklung, Indiziert alle Seiten, die in der Google-Sitemap auftauchen unter Berücksichtigung der bekannten Bereichsdefinierungen TYPO3SEARCH_begin und TYPO3SEARCH_end.</p>
<p>Dann noch den User &#8220;_cli_powersearchindexlucene&#8221; im Backend anlegen das ist der User, der über das CLI den Zugriff auf alle Seiten erhält. Passwort ist egal.</p>
<p>Dann musste ich meinen Server erstmal für das CLI fit machen. Folgende Codes habe ich auf der Shell ausgeführt:</p>
<p>Update der apt-get Bibliothek:<br />
#apt-get update</p>
<p>Sudo (Superuser do) installierien:<br />
#apt-get install sudo</p>
<p>CLI installieren für php5:<br />
#sudo apt-get install php5 php5-cli</p>
<p>Jetzt melde ich mich am Linux als Apache user www-data an (muss ich nicht, falls ich schon derjenige bin, bei Mittwald beispielsweise ist das der p*****-User):<br />
#su www-data</p>
<p>Jetzt musste ich das Zend Framework installieren und den Zend Ordner registrieren, das macht man am besten in der localconf.php. Vorsicht bei TYPO3-Versionen 4.2, hier wird der Standard-Include-Path überschrieben und TYPO3 funktioniert nicht mehr. Hier sollte der Include-Path an die bestehenden angehängt werden.! Die Zend-Extension im TYPO3-Repository ist auch nicht immer die beste Lösung.<br />
ini_set(&#8220;include_path&#8221;, &#8220;/var/www/ZendFramework/library/&#8221;);</p>
<p>Und ab geht die Post, der erste Index kann erstellt werden.<br />
#php /var/www/banquo/typo3conf/ext/powersearchindexlucene/cli/indexer.php</p>
<p>Jetzt legt der Indexer einen Index unter typo3temp/powersearchindexlucene/ an, diesen kann man auch sehen.</p>
<p>Wir werden sicherlich noch etwas aufräumen und eventuell ein Update der Original-Powersearch Extensions anfragen. Derzeit ist das Paket noch funktional im Beta-Stadium.</p>
<p>UPDATE&#8212;&#8212;&#8212;&#8212;&#8211;<br />
Die Firma d.k.d. hat bei der T3AK09 in München ein Open Source Projekt vorgestellt, bei welchem Lucene in der Hülle von Solr eine prima Suchmaschine abgeben soll. Hier gibts dann auch Antworten auf die Frage: Ähnlichkeitssuche, Suchtrefferqualifizierung, Hochskalierbarkeit. Das Projekt ist eben noch in der Schmiede, es wird jedoch um Mitarbeit gebeten, Kontakt Olivier Doberkau (Xing: https://www.xing.com/profile/Olivier_Dobberkau )</p>
<p>Zudem haben wir eine neue Extension Namens &#8220;Lucene&#8221; im Alpha Stadium hochgeladen, welche mehrere verschiedene Kanäle wie Websites, RSS Feeds, XML Sitemaps, Blog-Artikel, Verzeichnisse indizieren kann.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.marit.ag/2008/09/09/typo3-und-die-lucene-suche-von-zend/feed/</wfw:commentRss>
		<slash:comments>13</slash:comments>
		</item>
	</channel>
</rss>

