Try convert it into unicode?<br>
<br>
- RuiXian<br><br><div><span class="gmail_quote">On 4/20/07, <b class="gmail_sendername">Christoph P. Kukulies</b> <<a href="mailto:kuku@physik.rwth-aachen.de">kuku@physik.rwth-aachen.de</a>> wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
I got a bunch of HTML-pages<br>"<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">"<br>"<html>"<br>"<head>"<br>  "<meta content="text/html; charset=ISO-8859-15""
<br> "http-equiv="content-type">"<br><br>(Hope, I succeeded in guarding the HTML code against expansion though<br>mail-readers with the quotes)<br><br>The file contains Umlauts, like "für" in this text. The ü is not
<br>represented a HTML character \&uuml; but as 8bit character, hex code<br>0xfc.<br><br>The files all came in a ZIP file. I uploaded that ZIP-file to a folder I<br>created (a download special folder - hope that doesn't influence things
<br>negatively).<br><br>The files appeared as text file.<br>I created a page for each HTML file and pasted the content into the<br>"Inhalt" section of my page.<br><br>The result, when I vie the page, is, that all umlaut and othe 8bit
<br>characters appear as question mark surrounded by a black diamond.<br><br>Any clues what the best way would be to transport the pages from<br>an outside textediting-system (like MS Word) into OpenCms for<br>publishing?
<br><br>--<br>Chris Christoph P. U. Kukulies kukulies (at) <a href="http://rwth-aachen.de">rwth-aachen.de</a><br><br><br>_______________________________________________<br>This mail is sent to you from the opencms-dev mailing list
<br>To change your list options, or to unsubscribe from the list, please visit<br><a href="http://lists.opencms.org/mailman/listinfo/opencms-dev">http://lists.opencms.org/mailman/listinfo/opencms-dev</a><br></blockquote></div>
<br>