<HTML><HEAD>
<META http-equiv=Content-Type content="text/html; charset=iso-8859-15">
<META content="MSHTML 6.00.6000.17095" name=GENERATOR></HEAD>
<BODY style="MARGIN: 4px 4px 1px; FONT: 10pt Tahoma; COLOR: #000000">
<DIV>Thanks Paul!</DIV>
<DIV> </DIV>
<DIV>That's just what we were looking for!</DIV>
<DIV> </DIV>
<DIV>Tony<BR><BR>>>> Paul-Inge Flakstad <flakstad@npolar.no> 31/Mar/2011 8:48 pm >>><BR>Hi Tony,<BR><BR>If I understand you correctly, your xmlcontent ("structured content") contains a mix of elements that you do want to be indexed and elements that you don't want to be indexed.<BR><BR>In this case, use the "searchsetting" in your XSD to specify elements that shouldn't be indexed, like this:<BR><BR><xsd:appinfo><BR>    ...<BR>    <searchsettings><BR>        <searchsetting element="MyElementName" searchcontent="false" /><BR>    </searchsettings><BR>    ...<BR></xsd:appinfo><BR><BR>In the example above, any content inside "MyElementName" will not be indexed.<BR><BR>Note that for an existing index to reflect changes in the "searchsettings" section, simply rebuilding the index is not suffucient. Assuming you're using Tomcat, you'll need to stop Tomcat, delete the search index - located at {Tomcat home}/webapps/{OpenCms webapp name}/WEB-INF/index/ - start Tomcat again, and then rebuild the search index in OpenCms.<BR><BR>Additionally, a handy feature (in case you were not aware of it):<BR>To prevent entire files/folders from being indexed, set the property "search.exclude" to "true". (I use this approach for certain resource types.)<BR><BR>Hope this helps.<BR><BR>Best regards,<BR>Paul<BR>________________________________________<BR>Fra: opencms-dev-bounces@opencms.org [opencms-dev-bounces@opencms.org] p&#229; vegne av Tony Thul [TTHUL@regina.ca]<BR>Sendt: 31. mars 2011 19:04<BR>Til: opencms-dev@opencms.org<BR>Emne: [opencms-dev] XMLContent search settings<BR><BR>We want users to be able to search both XML content pages and PDF's through one index. In our field configuration we have Content which is mapped to "content" and XMLContent which is mapped to Parameter = Content[1].<BR><BR>The problem is the XML content pages are analyzed for Content and XMLContent. This results in the excerpt using text from Content which displays text from other elements in the XML file that we don't want part of the excerpt. If we remove Content from the field configuration then XML content pages work but PDF content doesn't get indexed.<BR><BR>Any Ideas?<BR><BR>Thanks!<BR>Tony<BR><BR><BR>DISCLAIMER: The information transmitted is intended only for the addressee and may contain confidential, proprietary and/or privileged material. Any unauthorized review, distribution or other use of or the taking of any action in reliance upon this information is prohibited. If you received this in error, please contact the sender and delete or destroy this message and any copies.<BR><BR><BR>_______________________________________________<BR>This mail is sent to you from the opencms-dev mailing list<BR>To change your list options, or to unsubscribe from the list, please visit<BR><A href="http://lists.opencms.org/mailman/listinfo/opencms">http://lists.opencms.org/mailman/listinfo/opencms</A>-dev<BR></DIV><BR>

    <p>
      <font size="2" face="Tahoma"><b>DISCLAIMER:</b> The information 
      transmitted is intended only for the addressee and may contain 
      confidential, proprietary and/or privileged material. Any unauthorized 
      review, distribution or other use of or the taking of any action in 
      reliance upon this information is prohibited. If you received this in 
      error, please contact the sender and delete or destroy this message and 
      any copies. </font>
    </p>
  </BODY></HTML>