Überblick über die Codepages und die Unicode
Transcription
Überblick über die Codepages und die Unicode
StreamServe Persuasion SP4 Codepages und UnicodeUnterstützung Benutzerhandbuch Rev A StreamServe Persuasion SP4Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A © 2007 StreamServe, Inc. StreamServe ist eine Marke von StreamServe, Inc. Ohne ausdrückliche schriftliche Genehmigung von StreamServe, Inc. darf kein Teil dieses Dokuments in einer beliebigen Form oder mit beliebigen Hilfsmitteln zu einem beliebigen Zweck auf elektronischem oder mechanischem Wege vervielfältigt oder übertragen werden. Bei den in diesem Dokument enthaltenen Informationen sind Änderungen vorbehalten. StreamServe, Inc. übernimmt keine Haftung für Folgeschäden aus Fehlern oder Ungenauigkeiten, die in diesem Handbuch auftreten können. Alle eingetragenen Namen, Produktnamen und Marken von anderen Unternehmen werden in dieser Dokumentation lediglich zur Identifizierung verwendet und sind Eigentum des jeweiligen Unternehmens. Unternehmen, Namen und Daten, die in Beispielen in diesem Dokument verwendet werden, sind, sofern nicht anders angegeben, erfunden. StreamServe, Inc. übernimmt keine Garantie, Verantwortung oder Haftung jeglicher Art bezüglich Produkten und Diensten von Drittanbietern einschließlich der Haftung für Schäden, die aufgrund der Inkompatibilität von Drittanbieterprodukten und -diensten mit den Produkten und Diensten von StreamServe, Inc. auftreten. Durch die Verwendung von StreamServe-Produkten und in diesem Dokument aufgeführten Drittanbieterprodukten erklären Sie sich damit einverstanden, StreamServe, Inc. bezüglich Drittanbieterprodukten und -diensten nicht für Schäden verantwortlich oder haftbar zu machen und auch nicht die Absicht zu haben, dies zu tun. Die Marken, Logos und Dienstleistungsmarken in diesem Dokument sind Eigentum von StreamServe, Inc. oder von Drittanbietern. Es ist unzulässig, die Marken ohne ausdrückliche schriftliche Genehmigung durch StreamServe, Inc. oder den als Eigentümer der Marken auftretenden Drittanbieter zu verwenden. Die Verwendung des StreamServe-Produkts mit Drittanbieterprodukten, die in diesem Dokument nicht erwähnt werden, erfolgt auf eigenes Risiko – auch in Bezug auf die StreamServe-Produkte. StreamServe-Website http://www.streamserve.com 3 Inhalt Überblick über die Codepages und die Unicode-Unterstützung..................5 Codepages und Unicode-Unterstützung in StreamServe ................................ 6 Festlegen einer Standardcodepage für Design Center.................................. 8 Bekannte Einschränkungen ........................................................................... 9 Von StreamServer unterstützte Codepages ...................................................... 9 Angeben von Codepages für die Eingabedaten ..........................................13 Identifizieren der zum Codieren von Eingabedaten verwendeten Codepage............................................................................................................14 Festlegen von Codepages per Eingabe-Connector........................................ 15 Festlegen von Codepages per Eingabetyp .....................................................17 Dynamisches Auswählen von Codepages für eine Event-Eingabe ..............19 Angeben von Codepages für die Ausgabedaten .........................................21 Angeben von Codepages für Unterstützungsdateien und Protokolle.......23 Angeben von Codepages für Tabellendateien ................................................ 23 Angeben von Codepages für Funktionsdateien ............................................. 25 Angeben von Codepages für das Protokoll .................................................... 26 Bidirektionaler Text ........................................................................................27 Neuordnen einer visuell geordneten Eingabe.................................................28 Neuordnen von seitenformatierter Eingabe ................................................. 28 Neuordnen von feld- und datensatzbasierter Eingabe................................. 28 Neuordnen der Ausgabe in der visuellen Reihenfolge...................................29 Neuordnen von seitenformatierter Ausgabe ................................................ 29 Neuordnen von datensatzbasierter Ausgabe............................................... 30 StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A 4 StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A 5 Überblick über die Codepages und die Unicode-Unterstützung Der Unicode-Standard bietet einen Codepunkt für jedes in den heutigen Sprachen verwendete Zeichen. Unicode ermöglicht die fehlerfreie plattform-, system- und programmunabhängige Übertragung unformatierter Textdaten. Unicode standardisiert drei Codierungsformate und sieben Codierungsschemas: Codierungsformate • UTF-8 • UTF-16 • UTF-32 Zuordnung einer Zeichensatzdefinition zu den tatsächlichen zur Darstellung der Daten verwendeten Codeeinheiten. Codierungsschemas • UTF-8 • UTF-16BE • UTF-16LE • UTF-16 • UTF-32 • UTF-32BE • UTF-32LE Codierungsformat plus Byte-Serialisierung sowie mögliche Verwendung der Markierung für die Bytereihenfolge (Byte Order Mark, BOM). Eine Codepage ist ein codierter Zeichensatz, bei dem jedes Zeichen einem eindeutigen Code im Unicode-Coderaum zugeordnet ist. Codepages decken in der Regel nur einen kleinen Teil der Unicode-Zeichen ab. Weitere Informationen zum Unicode-Standard finden Sie unter http://www.unicode.org. StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A 6 Codepages und Unicode-Unterstützung in StreamServe Überblick über die Codepages und die Unicode-Unterstützung Codepages und Unicode-Unterstützung in StreamServe StreamServer und die StreamServe-Tools unterstützen Unicode Version 2.1 in den folgenden Codierungsschemas: • UTF-8 (mit und ohne BOM) • UTF-16 • UTF-16BE • UTF-16LE In Unicode Version 2.1 ist die Unterstützung für alle Unicode-Codierungsschemas auf die BMP-Zeichen (Basic Multilingual Plane) beschränkt. Auf UTF-16 in BMP wird in den StreamServe-Tools als UCS-2 verwiesen. Verarbeitung der Zeichencodierung durch StreamServer StreamServer verarbeitet intern alle Daten im UCS-2-Codierungsformat. Das bedeutet, dass die Eingabedaten nach UCS-2 konvertiert werden müssen, bevor StreamServer mit der Datenverarbeitung beginnen kann. Nach Abschluss der Datenverarbeitung durch StreamServer werden die Ausgabedaten mithilfe der entsprechenden Codepage codiert. Damit die Eingabe ohne Beschädigung der Eingabedaten nach UCS-2 konvertiert werden kann, muss StreamServer wissen, welche Codepage zur Codierung der Eingabedaten verwendet wurde. Sie müssen diese Angabe bei der Konfiguration des Projekts vornehmen. Außerdem müssen Sie festlegen, welche Codepage zur Codierung der Ausgabedaten verwendet wird. Beispiel 1 Ein- und Ausgabecodierung nach ISO 8859-15. In diesem Beispiel sind die Eingabedaten nach ISO 8859-15 codiert. StreamServer konvertiert die Eingabedaten nach UCS-2, verarbeitet die Daten und codiert die Ausgabedaten nach ISO 8859-15, bevor sie an den Drucker geschickt werden. Vorbereiten der Arbeitsstationsumgebung Bevor Sie Projekte in Design Center konfigurieren können, müssen Sie die Arbeitsstationsumgebung hinsichtlich der zu verwendenden Schriftarten und Codepages und der Sprachversion des Betriebssystems vorbereiten. Sofern möglich, sollten Sie die entsprechende Sprachversion des Betriebssystems verwenden. Versuchen Sie also, ein Projekt in Griechisch immer auf einem Betriebssystem mit der griechischen Sprachversion zu konfigurieren. StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A Codepages und Unicode-Unterstützung in StreamServe Überblick über die Codepages und die Unicode-Unterstützung Sie müssen sicherstellen, dass alle erforderlichen Schriftarten sowie ggf. eine komplexe Skriptunterstützung (z. B. für Arabisch und Hebräisch) zur Verfügung stehen. Informationen hierzu erhalten Sie in der Dokumentation zu Microsoft® Windows® oder von Ihrem Systemadministrator. Angeben von Codepages für Eingabe- und Ausgabedaten Codepages für die Eingabe können als Filter in Filterketten angegeben werden, die Sie dem Eingabe-Connector hinzufügen. Eine Codepage kann auch für das Event angegeben werden, entweder mithilfe der Skriptfunktion ConvCurrMsgToUC in einem Retrieved-Skript oder durch die Verwendung von Nachschlagetabellen oder Skriptaliasen. Codepages für die Ausgabe werden in der Ausgabe-Connector-Konfiguration (Platform) festgelegt. Weitere Informationen finden Sie unter Angeben von Codepages für die Eingabedaten auf Seite 13 und Angeben von Codepages für die Ausgabedaten auf Seite 21. Wenn Sie keine Codepage für die Eingabedaten angeben, kann StreamServer die Daten möglicherweise nicht korrekt verarbeiten. Wenn die Eingabedaten jedoch ISO 8859-1 (Latin 1) entsprechen, ist die Festlegung einer Codepage für die Eingabe nicht erforderlich. Entsprechen sowohl Eingabe- als auch Ausgabedaten ISO 8859-1, kann auch die Festlegung einer Codepage für die Ausgabe entfallen. Bidirektionaler Text Unformatierte Textdaten, die Text in Arabisch oder Hebräisch in logischer Reihenfolge enthalten, werden genauso behandelt wie Daten, die unidirektionalen Text (von links nach rechts) enthalten. Arabischer und hebräischer Text in visueller Reihenfolge muss neu in logischer Reihenfolge angeordnet werden, bevor StreamServer den Text verarbeiten kann. Auch die Ausgabe von StreamServer kann ggf. von der logischen in die visuelle Reihenfolge neu geordnet werden (z. B. arabischer Text bei PDF-Ausgabe). Weitere Informationen finden Sie unter Bidirektionaler Text auf Seite 27. Exportieren von Dateien aus Design Center Alle in den Exportvorgang aus Design Center eingeschlossenen Konfigurationsdateien sind UTF-8-codiert. Tabellen- und Funktionsdateien Alle Tabellen- und Funktionsdateien müssen UTF-8-codiert sein. Weitere Informationen finden Sie unter Angeben von Codepages für Tabellendateien auf Seite 23 und Angeben von Codepages für Funktionsdateien auf Seite 25. StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A 7 8 Codepages und Unicode-Unterstützung in StreamServe Überblick über die Codepages und die Unicode-Unterstützung Protokolldateien Wenn im Protokoll von StreamServer andere als Latin-1-Zeichen angezeigt werden sollen, können Sie die Programmstartargumente -logfilecp und -logcp verwenden. Weitere Informationen finden Sie unter Angeben von Codepages für das Protokoll auf Seite 26. ODBC-Skriptfunktionen Die folgenden ODBC-Skriptfunktionen können zum Festlegen von Codepages verwendet werden, wenn die Eingabedaten aus einer ODBC-Datenquelle abgerufen werden: • OdbcSetCodepage • OdbcConnectW Informationen hierzu finden Sie im Handbuch Scripting Reference. Festlegen einer Standardcodepage für Design Center Sie können für Design Center eine Standardcodepage festlegen. Diese Codepage ist dann die Standardcodepage bei allen von Ihnen erstellten Projekten. Sie können für jedes Projekt in Design Center die Standardcodepage überschreiben und eine neue Standardcodepage für das Projekt angeben. Wenn Sie einen Codepagefilter für einen Eingabe-Connector oder eine Codepage für einen AusgabeConnector erstellen, wird automatisch die Standardcodepage des Projekts ausgewählt. So legen Sie eine Standardcodepage für Design Center fest 1 Wählen Sie in Design Center Extras > Design Center-Einstellungen aus. Das Dialogfeld Design Center-Einstellungen wird geöffnet. 2 Wählen Sie in der Dropdownliste Standardcodepage die geeignete Codepage aus. So legen Sie für ein Projekt eine Standardcodepage fest 1 Öffnen Sie das Projekt in Design Center. 2 Klicken Sie im Projekt-Browser mit der rechten Maustaste auf den obersten Knoten, und wählen Sie die Option Einstellungen aus. Das Dialogfeld Projekteinstellungen wird geöffnet. 3 Wählen Sie in der Dropdownliste Standardcodepage die geeignete Codepage aus. StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A Von StreamServer unterstützte Codepages Überblick über die Codepages und die Unicode-Unterstützung Bekannte Einschränkungen Für die Unicode-Unterstützung durch StreamServe gelten einige Einschränkungen: • Unicode-codierter Text in Overlays, die in StreamServe Overlay Editor erstellt wurden, wird nicht unterstützt. • Der StreamServe MailOUT-Process unterstützt kein Unicode. Stattdessen müssen Sie einen SMTP (MIME)-Ausgabe-Connector und den entsprechenden Process verwenden. • Verwenden Sie in ausführbaren Skripts oder bei Variablen keine Zeichen außerhalb des ASCII-Bereichs. • Der Lotus Notes Fetch-Assistent unterstützt nur ASCII und bietet keine Unterstützung für Unicode. Von StreamServer unterstützte Codepages Name Beschreibung BIG5 Chinesisch (traditionell), Taiwan CNS 11643 Chinesisch (traditionell), Taiwan cp437_DOSLatinUS Microsoft DOS Englisch (USA) cp737_DOSGreek Microsoft DOS Griechisch cp775_DOSBaltRim Microsoft DOS Baltischer Raum cp850_DOSLatin1 Microsoft DOS Latin1 (Westeuropa) cp852_DOSLatin2 Microsoft DOS Latin2 (Osteuropa) cp855_DOSCyrillic Microsoft DOS Kyrillisch (Russland) cp857_DOSTurkish Microsoft DOS Türkisch cp860_DOSPortuguese Microsoft DOS Portugiesisch cp861_DOSIcelandic Microsoft DOS Isländisch cp862_DOSHebrew Microsoft DOS Hebräisch (Israel) cp863_DOSCanadaF Microsoft DOS CanadaF (Kanada – Französisch) cp864_DOSArabic Microsoft DOS Arabisch cp865_DOSNordic Microsoft DOS Nordische Sprachen cp866_DOSCyrillicRussian Microsoft DOS Kyrillisch (Russland) StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A 9 10 Von StreamServer unterstützte Codepages Überblick über die Codepages und die Unicode-Unterstützung Name Beschreibung cp874_DOSThai Microsoft DOS Thai cp932_ShiftJIS Microsoft ShiftJIS (Japanisch – Industriestandard) cp936_GBK Microsoft GBK (Chinesisch – vereinfacht) cp949_UnifiedHangul Microsoft Unified Hangul (Korea) cp950_Big5 Microsoft Big5 (Chinesisch – traditionell, Taiwan) cp950_Big5_HKSCS-2001 Microsoft Big5 (Hongkong – zusätzlicher Zeichensatz) cp1250_WinLatin2 Microsoft Windows Latin2 (Osteuropa) cp1251_WinCyrillic Microsoft Windows Kyrillisch (Russland) cp1252_WinLatin1 Microsoft Windows Latin1 (Westeuropa & USA) cp1253_WinGreek Microsoft Windows Griechisch cp1254_WinTurkish Microsoft Windows Türkisch cp1255_WinHebrew Microsoft Windows Hebräisch (Israel) cp1256_WinArabic Microsoft Windows Arabisch cp1257_WinBaltic Microsoft Windows Baltisch cp1258_WinVietnamese Microsoft Windows Vietnamesisch GB2312-80 Chinesisch (vereinfacht) IBM CP 37 Common Europe EBCDIC IBM CP 256 IBM Niederlande EBCDIC IBM CP 273 Österreich/Deutschland EBCDIC IBM CP 277 Dänemark/Norwegen EBCDIC IBM CP 278 Finnland/Schweden EBCDIC IBM CP 280 Italienisch EBCDIC IBM CP 284 Spanisch EBCDIC IBM CP 285 Englisch (Großbritannien) EBCDIC IBM CP 297 Französisch EBCDIC IBM CP 423 Griechisch EBCDIC StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A Von StreamServer unterstützte Codepages Überblick über die Codepages und die Unicode-Unterstützung Name Beschreibung IBM CP 424 Hebräisch EBCDIC IBM CP 500 International EBCDIC IBM CP 852 Latin 2 PC-DATA IBM CP 870 Latin-2 EBCDIC IBM CP 875 Griechisch EBCDIC IBM CP 1026 IBM Türkisch Latin-5 IBM CP 1140 USA-Kanada-Euro EBCDIC IBM CP 1141 Deutschland-Euro EBCDIC IBM CP 1142 Dänemark-Norwegen-Euro EBCDIC IBM CP 1143 Finnland-Schweden-Euro EBCDIC IBM CP 1144 Italien-Euro EBCDIC IBM CP 1145 Spanien-Euro EBCDIC IBM CP 1146 GB-Euro EBCDIC IBM CP 1147 Frankreich-Euro EBCDIC IBM CP 1149 Island-Euro EBCDIC ISO 8859-1 Westeuropa ISO 8859-2 Osteuropa ISO 8859-3 Südeuropa, Malta ISO 8859-4 Nordeuropa, Baltische Staaten, Grönland ISO 8859-5 Kyrillisch (Russland) ISO 8859-6 Arabisch ISO 8859-7 Griechisch ISO 8859-8 Hebräisch ISO 8859-9 Türkisch ISO 8859-10 Nordisch ISO 8859-13 Baltischer Raum ISO 8859-14 Keltische Sprachen ISO 8859-15 ISO 8859-1 + Euro-Zeichen und zusätzliche Zeichen für Frankreich/Finnland StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A 11 12 Von StreamServer unterstützte Codepages Überblick über die Codepages und die Unicode-Unterstützung Name Beschreibung JIS 0212 Japanisch (Industriestandard) Roman-8 HP-Roman8 Shift-JIS Japanisch (Industriestandard) Unified Hangeul KSC5601- Koreanisch DBCS 87 Unified Hangeul KSC5601- Koreanisch DBCS 92 Unified Hangeul KSX1001 Koreanisch DBCS Unicode (UCS-2) Unicode-Codierungsschemas UTF-16, UTF16BE, UTF-16LE (beschränkt auf BMP) UTF8 Unicode-Codierungsschema(s) UTF-8, mit oder ohne BOM (beschränkt auf BMP) StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A 13 Angeben von Codepages für die Eingabedaten Sie müssen angeben, welche Codepage die Quellanwendung zum Codieren der Eingabe für StreamServer verwendet. Zuerst identifizieren Sie die zum Codieren der Eingabe verwendete Codepage (siehe Identifizieren der zum Codieren von Eingabedaten verwendeten Codepage auf Seite 14). Anschließend wählen Sie diese Codepage beim Konfigurieren der Codepageeinstellungen für die Eingabe in Design Center aus. Verwenden Sie nach Möglichkeit ein Unicode-Codierungsschema für die Eingabedaten. Per Eingabe-Connector angewendete Codepages Wenn für alle von einem Eingabe-Connector empfangenen Eingabedaten dieselbe Codepage verwendet wird, können Sie für den Eingabe-Connector eine Codepage festlegen. Weitere Informationen finden Sie unter Festlegen von Codepages per Eingabe-Connector auf Seite 15. Per Eingabetyp angewendete Codepages Wenn der Eingabe-Connector unterschiedliche Eingabetypen empfängt und die Eingabetypen mit verschiedenen Codepages codiert sind, können Sie je Eingabetyp eine Codepage festlegen. Weitere Informationen finden Sie unter Festlegen von Codepages per Eingabetyp auf Seite 17. Retrieved-Skript oder Nachschlage-/Skriptalias für Event Sie können mithilfe eines Retrieved-Skripts oder Nachschlage-/Skriptaliasen dynamisch eine Codepage für eine Event-Eingabe auswählen. Weitere Informationen finden Sie unter Dynamisches Auswählen von Codepages für eine EventEingabe auf Seite 19. StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A 14 Identifizieren der zum Codieren von Eingabedaten verwendeten Codepage Angeben von Codepages für die Eingabedaten Identifizieren der zum Codieren von Eingabedaten verwendeten Codepage Informationen zu der zum Codieren der Eingabedaten verwendeten Codepage erhalten Sie meist in der Dokumentation zur Datenquelle oder vom Systemadministrator. Sie können zum Identifizieren der verwendeten Codepage auch eine Eingabedaten-Musterdatei in StreamServe UTF Edit öffnen. So identifizieren Sie mithilfe von UTF Edit die Codepage 1 Wählen Sie in UTF Edit Bearbeiten > Schriftart festlegen. 2 Wählen Sie in der Dropdownliste Schriftart eine Schriftart aus, die eine Vielzahl von Codepages unterstützt (z. B. Arial), und klicken Sie auf OK . 3 Öffnen Sie die Eingabedaten-Musterdatei. 4 Wählen Sie Bearbeiten > Codepage aus, und wählen Sie dann eine Codepage aus, die in UTF Edit alle Zeichen fehlerfrei anzeigt. Falls Sie die passende Codepage nicht finden können, wiederholen Sie den Vorgang mit einer anderen Schriftart. Führt auch dies nicht zum Erfolg, müssen Sie eine geeignete Schriftart installieren. StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A Festlegen von Codepages per Eingabe-Connector Angeben von Codepages für die Eingabedaten Festlegen von Codepages per EingabeConnector Wenn für alle über einen Eingabe-Connector empfangenen Eingabedaten dieselbe Codepage verwendet wird, können Sie die Codepage beim Konfigurieren des Eingabe-Connectors in der Platform angeben. So legen Sie die Codepage fest 1 Erstellen Sie eine neue, oder verwenden Sie eine vorhandene Filterkette. 2 Öffnen Sie die Filterkette. 3 Klicken Sie in Filter Chain Editor mit der rechten Maustaste auf die Filterleiste (FlowBar), und wählen Sie die Option Filter hinzufügen > Codepage Filter aus. Dem Flussdiagramm wird ein neuer Codepagefilter hinzugefügt. 4 Wählen Sie in der Dropdownliste Codepage die geeignete Codepage aus. 5 Speichern Sie die Filterkette, und schließen Sie Filter Chain Editor. 6 Aktivieren Sie die allgemeine Ebene in der Platform-Ansicht. 7 Doppelklicken Sie in der Platform-Ansicht auf den Eingabe-Connector. Das Dialogfeld Eingabe-Connector-Einstellungen wird geöffnet. 8 Klicken Sie auf das Symbol Filterkette, und wählen Sie die Filterkette mit dem Codepagefilter aus. So geben Sie die Bytereihenfolge für UCS-2-codierte Daten an Bei den UTF-16-Codierungsschemas wird jeder Zeichencode durch zwei Byte dargestellt. Wenn Sie UCS-2 als Codepage auswählen, müssen Sie festlegen, wie die Byte für jede Zeicheneinheit angeordnet sind: höchstwertiges Byte zuerst oder zuletzt. Wählen Sie in der Dropdownliste Bytereihenfolge die entsprechende Option aus. Option Verwendung Höchstwertiges Byte zuerst (Big Endian) Wenn die Eingabe mithilfe des Codierungsschemas UTF-16BE (Big Endian ohne Markierung für die Bytereihenfolge) oder UTF-16 (Big Endian mit oder ohne Markierung für die Bytereihenfolge) codiert ist. Höchstwertiges Byte zuletzt (Little Endian) Wenn die Eingabe mithilfe des Codierungsschemas UTF-16LE (Little Endian ohne Markierung für die Bytereihenfolge) oder UTF-16 (Little Endian mit Markierung für die Bytereihenfolge) codiert ist. StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A 15 16 Festlegen von Codepages per Eingabe-Connector Angeben von Codepages für die Eingabedaten Beispiel 2 Mit dem Eingabe-Connector (Platform) verbundene Codepagefilter In diesem Beispiel sind die über den Eingabe-Connector empfangenen Eingabedaten ISO 8859-15-codiert. Ein Codepagefilter mit der Codepage ISO 8859-15 ist mit dem Eingabe-Connector verbunden. StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A Festlegen von Codepages per Eingabetyp Angeben von Codepages für die Eingabedaten Festlegen von Codepages per Eingabetyp Wenn der Eingabe-Connector unterschiedliche Eingabetypen (XML-, seitenformatiert usw.) empfängt und die Eingabetypen mit verschiedenen Codepages codiert sind, können Sie je Eingabetyp eine Codepage angeben. Informationen über Filterketten nach Eingabetyp finden Sie in der Dokumentation zu Design Center. So geben Sie die Codepages an 1 Erstellen Sie eine neue, oder verwenden Sie eine vorhandene Filterkette. 2 Öffnen Sie die Filterkette. 3 Klicken Sie in Filter Chain Editor mit der rechten Maustaste auf die Filterleiste (FlowBar), und wählen Sie die Option Filter hinzufügen > Codepage Filter aus. Dem Flussdiagramm wird ein neuer Codepagefilter hinzugefügt. 4 Wählen Sie in der Dropdownliste Codepage die geeignete Codepage aus. 5 Speichern Sie die Filterkette, und schließen Sie Filter Chain Editor. 6 Wiederholen Sie die Schritte 1 bis 5 für jeden Eingabetyp und jede Codepage. 7 Klicken Sie im Projekt-Browser mit der rechten Maustaste auf den Projektknoten, und wählen Sie die Option Einstellungen für Projektexport aus. Das Dialogfeld Einstellungen für Projektexport wird geöffnet. 8 Wählen Sie die Registerkarte InputAnalyzer aus. 9 Wählen Sie in der Liste Verfügbare Connectors den Connector aus. 10 Klicken Sie für jeden Eingabetyp in der Liste der Input Analyzer-Einstellungen auf das Symbol Filterkette auswählen, und wählen Sie die Filterkette aus, die den Codepagefilter für den Eingabetyp enthält. Hinweis: Wenn Sie sowohl im Dialogfeld Platform als auch im Dialogfeld Einstellungen für Projektexport einen Codepagefilter mit dem Connector verbinden, kann StreamServer nicht starten. So geben Sie die Bytereihenfolge für UCS-2-codierte Daten an Bei den UTF-16-Codierungsschemas wird jeder Zeichencode durch zwei Byte dargestellt. Wenn Sie UCS-2 als Codepage auswählen, müssen Sie festlegen, wie die Byte für jede Zeicheneinheit angeordnet sind: höchstwertiges Byte zuerst oder zuletzt. StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A 17 18 Festlegen von Codepages per Eingabetyp Angeben von Codepages für die Eingabedaten Wählen Sie in der Dropdownliste Bytereihenfolge die entsprechende Option aus. Beispiel 3 Option Verwendung Höchstwertiges Byte zuerst (Big Endian) Wenn die Eingabe mithilfe des Codierungsschemas UTF-16BE (Big Endian ohne Markierung für die Bytereihenfolge) oder UTF-16 (Big Endian mit oder ohne Markierung für die Bytereihenfolge) codiert ist. Höchstwertiges Byte zuletzt (Little Endian) Wenn die Eingabe mithilfe des Codierungsschemas UTF-16LE (Little Endian ohne Markierung für die Bytereihenfolge) oder UTF-16 (Little Endian mit Markierung für die Bytereihenfolge) codiert ist. Codepagefilter in der Runtime-Konfiguration. In diesem Beispiel empfängt der Eingabe-Connector ISO 8859-15-codierte, seitenformatierte Daten und ISO 8859-2-codierte, XML-formatierte Daten. Ein Codepagefilter mit der Codepage ISO 8859-15 ist mit dem PageIN-Zweig, und ein Codepagefilter mit der Codepage ISO 8859-2 ist mit dem XMLIN-Zweig verbunden. StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A Dynamisches Auswählen von Codepages für eine Event-Eingabe Angeben von Codepages für die Eingabedaten Dynamisches Auswählen von Codepages für eine Event-Eingabe Sie können mithilfe von Nachschlage-/Skriptaliasen oder Retrieved-Skripts dynamisch eine geeignete Codepage für eine Event-Eingabe auswählen. Voraussetzungen • Die Eingabedaten müssen Single-Byte-Zeichen sein. • Dem Eingabe-Connector, der die Eingabedaten empfängt, ist kein Codepagefilter hinzugefügt. So wählen Sie Codepages mithilfe eines Retrieved-Skripts aus Fügen Sie dem Event ein Retrieved-Skript mit der Skriptfunktion ConvCurrMsgToUC hinzu. Informationen hierzu finden Sie im Handbuch Scripting Reference. So wählen Sie Codepages mithilfe von Nachschlage-/Skriptaliasen aus 1 Klicken Sie in der Runtime-Ansicht mit der rechten Maustaste auf das Event, und wählen Sie die Option Einstellungen. Das Dialogfeld RuntimeEvent-Einstellungen wird geöffnet. 2 Wählen Sie auf der Registerkarte Codepage die Option Nachschlagen oder Variable aus, und geben Sie die Aliaseinstellungen an. Informationen zu den Aliasauswahlmethoden finden Sie in der Dokumentation zu Design Center. Nachschlagetabellensyntax <Schlüsselwert> <Codepage> Kommentare: Beispiel 4 • Trennen Sie <Schlüsselwert> und <Codepage> mithilfe eines Tabulators. • Verwenden Sie Anführungszeichen, wenn der <Schlüsselwert> Leerzeichen enthält. • Als <Codepage> muss einer der unter Von StreamServer unterstützte Codepages auf Seite 9 aufgeführten Namen angegeben werden. Nachschlagetabelle "Westeuropa" ISO 8859-1 "Osteuropa" ISO 8859-2 Türkisch ISO 8859-9 StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A 19 20 Dynamisches Auswählen von Codepages für eine Event-Eingabe Angeben von Codepages für die Eingabedaten Beispiel 5 Codepageauswahl mithilfe einer Nachschlagetabelle. In diesem Beispiel empfängt das PageIN-Event sowohl ISO 8859-15-codierte als auch ISO 8859-2-codierte Eingabedaten. Mithilfe der folgenden Nachschlagetabelle wird dynamisch die geeignete Codepage ausgewählt: Westeuropa Osteuropa ISO 8859-15 ISO 8859-2 StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A 21 Angeben von Codepages für die Ausgabedaten Die Ausgabe kann die für die Eingabe festgelegte Codepage übernehmen oder eine separat angegebene Codepage nutzen. Die von Ihnen angegebene Codepage muss vom Ausgabegerät (z. B. einem Drucker) unterstützt werden. So legen Sie eine Codepage für die Ausgabe fest 1 Aktivieren Sie die allgemeine Ebene in der Platform-Ansicht. 2 Doppelklicken Sie in der Platform-Ansicht auf den Ausgabe-Connector. Das Dialogfeld Ausgabe-Connector-Einstellungen wird geöffnet. 3 Klicken Sie auf das Symbol Codepage, und wählen Sie die Option Codepage übernehmen oder die gewünschte Codepage in der Dropdownliste Codepage aus. Option Verwendung Codepage übernehmen Wenn Sie für Ein- und Ausgabe die gleiche Codepage verwenden möchten Name der Codepage Wenn Sie für die Ausgabe eine andere Codepage auswählen möchten. Diese Codepage muss mindestens alle von der Codepage für die Eingabe abgedeckten Zeichen enthalten. Dynamisches Auswählen von Codepages für die Ausgabe Die dynamische Auswahl von Codepages durch Anwenden von Skripts und Aliasen auf die Ausgabe ist nicht möglich. Wenn Sie jedoch eine dynamische Codepageauswahl für die Eingabe festlegen und für die Ausgabe die Option Codepage übernehmen auswählen, werden auch die Codepages für die Ausgabe dynamisch ausgewählt. So geben Sie die Bytereihenfolge für UCS-2-codierte Daten an Bei den UTF-16-Codierungsschemas wird jeder Zeichencode durch zwei Byte dargestellt. Wenn Sie UCS-2 als Codepage auswählen, müssen Sie festlegen, wie die Byte für jede Zeicheneinheit angeordnet sind: höchstwertiges Byte zuerst oder zuletzt. Wählen Sie in der Dropdownliste Bytereihenfolge die Option Höchstwertiges Byte zuletzt (Little Endian) oder Höchstwertiges Byte zuerst (Big Endian) aus. Die auszuwählende Bytereihenfolge hängt von der Anwendung ab, für die die Ausgabe bestimmt ist. StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A 22 Angeben von Codepages für die Ausgabedaten So fügen Sie UTF-8- und UCS-2-codierten Daten die Markierung für die Bytereihenfolge hinzu Aktivieren Sie das Kontrollkästchen Markierung für die Byte-Reihenfolge hinzufügen, wenn Sie am Beginn einer UCS-2-(UTF-16)- oder UTF-8-codierten Ausgabedatei eine Markierung für die Bytereihenfolge hinzufügen möchten. Die Anwendung, für die diese Ausgabe bestimmt ist, kann anhand dieser Markierung für die Bytereihenfolge automatisch die Codierung (UTF-8oder UTF-16-Codierungsschema) und die für die Daten im UTF-16Codierungsschema verwendete Bytereihenfolge bestimmen. StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A 23 Angeben von Codepages für Unterstützungsdateien und Protokolle In diesem Abschnitt finden Sie Informationen zum Angeben von Codepages für Support-Dateien und Protokolle. • Angeben von Codepages für Tabellendateien auf Seite 23 • Angeben von Codepages für Funktionsdateien auf Seite 25 • Angeben von Codepages für das Protokoll auf Seite 26 Angeben von Codepages für Tabellendateien Alle in Design Center verwendeten Tabellendateien müssen UTF-8-codiert sein. Damit StreamServer eine Tabellendatei als UTF-8-codiert interpretiert, muss die Datei mit der folgenden Textzeichenfolge beginnen: //!code page UTF8! Beispiel 6 UTF-8-codierte Tabellendatei //!code page UTF8! ENG Printer_1 SWE Printer_2 Aus einem Ressourcenset erstellte Tabellendateien Wenn Sie eine neue Tabellendatei aus einem Ressourcenset heraus erstellen, wird als Codierung automatisch UTF-8 festgelegt. Beim Öffnen der Tabellendatei im Ressourcen-Editor wird standardmäßig die die Codepage ausweisende Zeichenfolge //!code page UTF8! hinzugefügt. StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A 24 Angeben von Codepages für Tabellendateien Angeben von Codepages für Unterstützungsdateien und Protokolle Mit externen Text-Editoren erstellte Tabellendateien Sie können eine Tabellendatei mithilfe eines externen Text-Editors erstellen und dann die Tabellendatei in das Ressourcenset importieren. Vor dem Importieren der Datei müssen Sie folgende Aktionen ausführen: • Geben Sie als erste Textzeile die Zeichenfolge //!code page UTF8! ein. • Speichern Sie die Datei im UTF-8-Format. Tabellendateien in aktualisierten Projekten Wenn Sie Projekte aktualisieren, die mit einer Version vor 4.1 erstellt wurden, müssen Sie die Tabellendateien modifizieren. Vor dem Aktualisieren müssen Sie folgende Aktionen ausführen: • Geben Sie als erste Textzeile die Zeichenfolge //!code page UTF8! ein. • Speichern Sie die Datei im UTF-8-Format. StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A Angeben von Codepages für Funktionsdateien Angeben von Codepages für Unterstützungsdateien und Protokolle Angeben von Codepages für Funktionsdateien Alle in Design Center verwendeten Funktionsdateien müssen UTF-8-codiert sein. Damit StreamServer eine Funktionsdatei als UTF-8-codiert interpretiert, muss die Datei mit der folgenden Textzeichenfolge beginnen: CodePage UTF8 Beispiel 7 UTF-8-codierte Funktionsdatei CodePage UTF8 func timetotal() ... Aus einem Ressourcenset erstellte Funktionsdateien Wenn Sie eine neue Funktionsdatei aus einem Ressourcenset heraus erstellen, wird als Codierung automatisch UTF-8 festgelegt. Beim Öffnen der Funktionsdatei im Ressourcen-Editor wird standardmäßig die die Codepage ausweisende Zeichenfolge CodePage UTF8 hinzugefügt. Mit externen Text-Editoren erstellte Funktionsdateien Sie können eine Funktionsdatei mithilfe eines externen Text-Editors erstellen und dann die Funktionsdatei in das Ressourcenset importieren. Vor dem Importieren der Datei müssen Sie folgende Aktionen ausführen: • Geben Sie als erste Textzeile die Zeichenfolge CodePage UTF8 ein. • Speichern Sie die Datei im UTF-8-Format. Funktionsdateien in aktualisierten Projekten Wenn Sie Projekte aktualisieren, die mit einer Version vor 4.1 erstellt wurden, müssen Sie die Funktionsdateien modifizieren. Vor dem Aktualisieren müssen Sie folgende Aktionen ausführen: • Geben Sie als erste Textzeile die Zeichenfolge CodePage UTF8 ein. • Speichern Sie die Datei im UTF-8-Format. StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A 25 26 Angeben von Codepages für das Protokoll Angeben von Codepages für Unterstützungsdateien und Protokolle Angeben von Codepages für das Protokoll Sofern die im StreamServer-Protokoll angezeigten Zeichen Latin1-konform sind, müssen Sie keine Codepage für das Protokoll angeben. Wenn im Protokoll andere Zeichen angezeigt werden sollen, können Sie die Programmstartargumente -logfilecp und -logcp verwenden. Informationen dazu finden Sie im Referenzhandbuch Startup arguments. StreamServer über Control Center ausführen Wenn Sie StreamServer über Control Center ausführen, können Sie mithilfe des Programmstartarguments -logfilecp eine Codepage für die Protokolldatei angeben. StreamServer über die Befehlszeile ausführen Wenn Sie StreamServer über die Befehlszeile ausführen, können Sie mithilfe des Programmstartarguments -logcp eine Codepage für die Protokolldatei angeben. StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A 27 Bidirektionaler Text Bidirektionaler Text besteht zum Großteil aus von rechts nach links verlaufendem Text mit verschachtelten Segmenten entgegengesetzter Ausrichtung (oder andersherum). In Sprachen mit bidirektionalem Text (StreamServer unterstützt Arabisch und Hebräisch) verläuft der allgemeine Textfluss horizontal von rechts nach links, Zahlen werden aber von links nach rechts geschrieben. Darüber hinaus werden eingebettete Adressen, Akronyme und Zitate aus einer von links nach rechts verlaufenden Sprache ebenfalls von links nach rechts geschrieben. Logische und visuelle Reihenfolge Bidirektionaler Text kann visuell und logisch angeordnet sein: • Logische Reihenfolge: Die Zeichen sind in derselben Reihenfolge ange- ordnet, in der sie eingegeben wurden. In diesem Fall spielt es keine Rolle, ob es sich um einen Text mit arabischen, hebräischen oder lateinischen Schriftzeichen handelt – die Richtung hat keine Bedeutung. • Visuelle Reihenfolge: Die Zeichen sind in der Reihenfolge angeordnet, in der sie auf einem Bildschirm, einer gedruckten Seite oder einem anderen Medium angezeigt werden. Eine visuell geordnete Eingabe muss zuerst logisch neu geordnet werden, bevor StreamServer den Text verarbeiten kann. Weitere Informationen finden Sie unter Neuordnen einer visuell geordneten Eingabe auf Seite 28. Die Ausgabe von StreamServer kann ggf. wieder in die visuelle Reihenfolge gebracht werden. Weitere Informationen finden Sie unter Neuordnen der Ausgabe in der visuellen Reihenfolge auf Seite 29. StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A 28 Neuordnen einer visuell geordneten Eingabe Bidirektionaler Text Neuordnen einer visuell geordneten Eingabe Eine visuell geordnete Eingabe muss zuerst logisch neu geordnet werden, bevor StreamServer den Text verarbeiten kann. Für die folgenden Events können Sie die Eingabe neu ordnen: • PageIN: Neuordnung erfolgt zeilenweise. Weitere Informationen hierzu finden Sie unter Neuordnen von seitenformatierter Eingabe auf Seite 28. • StreamIN: Neuordnung erfolgt feldweise. Weitere Informationen hierzu finden Sie unter Neuordnen von feld- und datensatzbasierter Eingabe auf Seite 28. Die Eingabe für alle anderen Events muss logisch geordnet sein. Neuordnen von seitenformatierter Eingabe Das Neuordnen der Eingabe können Sie bei der Konfiguration der Codepageeinstellungen für die Eingabe aktivieren. Weitere Informationen finden Sie unter Angeben von Codepages für die Eingabedaten auf Seite 13. So ordnen Sie die Eingabe mithilfe eines Codepagefilters neu Wählen Sie in der Dropdownliste Reihenfolge der Eingabedaten die Option Visuelle Reihenfolge (nur Arabisch und Hebräisch) aus. So ordnen Sie die Eingabe mithilfe von Aliasen neu (Runtime-EventEinstellungen) Wählen Sie in der Dropdownliste Reihenfolge der Eingabedaten die Option Visuelle Reihenfolge (nur Arabisch und Hebräisch) aus. So ordnen Sie die Eingabe mithilfe eines Retrieved-Skripts neu Legen Sie in ConvCurrMsgToUC(Codepage,visuelle_Reihenfolge) den Wert für visuelle_Reihenfolge auf 1 fest. Beispiel: ConvCurrMsgToUC("UTF8",1); Neuordnen von feld- und datensatzbasierter Eingabe Sie können die Neuordnung der Eingabe bei der Konfiguration des EingabeConnectors aktivieren. So ordnen Sie die Eingabe neu Geben Sie für den Eingabe-Connector das Schlüsselwort ReorderRTLField ein. Informationen zum Hinzufügen benutzerdefinierter Befehle und Schlüsselwörter für einen Connector finden Sie in der Dokumentation zu Design Center. Hinweis: Um dieses Schlüsselwort verwenden zu können, müssen Sie die Neu- ordnung der an diesem Connector empfangenen Eingabedaten mithilfe von Codepagefiltern, Aliasen oder Retrieved-Skripts aktivieren. StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A Neuordnen der Ausgabe in der visuellen Reihenfolge Bidirektionaler Text Neuordnen der Ausgabe in der visuellen Reihenfolge StreamServer verarbeitet Text in logischer Reihenfolge. Falls erforderlich, kann die Ausgabe in der visuellen Reihenfolge geordnet werden. Sie können die Ausgabe der folgenden Processes neu ordnen: • PageOUT: Neuordnung erfolgt absatzweise. Weitere Informationen hierzu finden Sie unter Neuordnen von seitenformatierter Ausgabe auf Seite 29. • StreamOUT: Neuordnung erfolgt feldweise. Weitere Informationen hierzu finden Sie unter Neuordnen von datensatzbasierter Ausgabe auf Seite 30. Neuordnen von seitenformatierter Ausgabe Auf dem Bildschirm oder Ausdruck dargestellter seitenformatierter, bidirektionaler Text ist normalerweise in visueller Reihenfolge angeordnet. Manche Ausgabegeräte ordnen den Text automatisch neu, d. h., dass die Ausgabe von StreamServer in logischer Reihenfolge vorliegen muss, wenn sie an ein solches Gerät gesendet wird. Die folgende Tabelle veranschaulicht, wie die Ausgabe von StreamServer für die verschiedenen Treibertypen geordnet sein muss. Treiber Ausgabe aus StreamServer PCL-Treiber visuelle Reihenfolge Postscript-Treiber visuelle Reihenfolge GIF, BMP usw. visuelle Reihenfolge RTF logische Reihenfolge PDF visuelle Reihenfolge Windows-Treiber logische Reihenfolge Visuell geordneter, seitenformatierter arabischer Text wird darüber hinaus geformt. Die Glyphen der Buchstaben werden miteinander verbunden, die LamAlif-Ligaturen werden gebildet, und spiegelbildliche Zeichen (z. B. runde und eckige Klammern) werden gespiegelt. Die kontextabhängige Formgebung muss daher auf Basis des Textes erfolgen, um die richtige Reihenfolge der Glyphen zu erzeugen. Wenn die Neuordnung der seitenformatierten Ausgabe aktiviert ist, wird die Formgebung automatisch ausgeführt. Diese Funktion erzeugt keine Vokalzeichen. Hinweis: Eine visuell geordnete arabischsprachige PCL-Ausgabe muss UTF-8- codiert sein. StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A 29 30 Neuordnen der Ausgabe in der visuellen Reihenfolge Bidirektionaler Text So ordnen Sie die Ausgabe mithilfe des Ausgabe-Connectors neu 1 Aktivieren Sie die allgemeine Ebene in der Platform-Ansicht. 2 Doppelklicken Sie in der Platform-Ansicht auf den Ausgabe-Connector. Das Dialogfeld Ausgabe-Connector-Einstellungen wird geöffnet. 3 Klicken Sie auf das Symbol Codepage, und wählen Sie die Option Bidirektionale Ausgabe visuell ordnen aus. So ordnen Sie die Ausgabe eines gespiegelten PageOUT-Layouts neu Wenn Sie eine PageOUT-Ausgabe spiegeln, wird die Neuordnung automatisch aktiviert. Weitere Informationen zum Spiegeln von Seitenlayouts finden Sie in der Dokumentation zu PageOUT. Neuordnen von datensatzbasierter Ausgabe Die datensatzbasierte Ausgabe sollte normalerweise in logischer Reihenfolge vorliegen. Sofern erforderlich, kann die Reihenfolge der Ausgabe in die visuelle Reihenfolge geändert werden. So ordnen Sie die Ausgabe neu 1 Aktivieren Sie die allgemeine Ebene in der Platform-Ansicht. 2 Doppelklicken Sie in der Platform-Ansicht auf den Ausgabe-Connector. Das Dialogfeld Ausgabe-Connector-Einstellungen wird geöffnet. 3 Klicken Sie auf das Symbol Codepage, und wählen Sie die Option Bidirektionale Ausgabe visuell ordnen aus. StreamServe Persuasion SP4 Codepages und Unicode-Unterstützung Benutzerhandbuch Rev A