FONTAINE 1.0

Kokuji.h

Go to the documentation of this file.
00001 //
00002 // The Fontaine Font Analysis Project 
00003 // 
00004 // Copyright (c) 2009 by Edward H. Trager
00005 // All Rights Reserved
00006 // 
00007 // Released under the GNU GPL version 2.0 or later.
00008 //     
00009 
00010 
00011 //
00012 // Kokuji.h
00013 //
00014 
00015 #ifndef ORTHOGRAPHY_DATA
00016 #include "../OrthographyData.h"
00017 #endif
00018 
00019 #ifndef KOKUJI
00020 #define KOKUJI
00021 
00022 namespace Kokuji{
00023 
00024 //
00025 // Unicode values
00026 // 
00027 // Based on a partial list presented at
00028 // http://www.sljfaq.org/w/kokuji,
00029 // this list should still be quite helpful in identifying
00030 // a truly Japanese font from a Chinese font ... maybe.
00031 //
00032 UINT32 values[]={
00033         0x9c2f,
00034         0x6a2b,
00035         0x7c81,
00036         0x55b0,
00037         0x8fbc,
00038         0x698a,
00039         0x9d2b,
00040         0x7cce,
00041         0x51e7,
00042         0x9c48,
00043         0x6802,
00044         0x8fbb,
00045         0x5ce0,
00046         0x6803,
00047         0x5678,
00048         0x51ea,
00049         0x5302,
00050         0x7551,
00051         0x7560,
00052         0x567a,
00053         0x92f2,
00054         0x8fba,
00055         0x67fe,
00056         0x4fe3,
00057         0x9ebf,
00058         0x7c8d,
00059         0x6762,
00060         0x7c7e,
00061         0x5301,
00062         0x9453,
00063         0x67a0,
00064         0x6bdf,
00065         0x4e44,
00066         0x6318,
00067         0x685b,
00068         0x68bb,
00069         END_OF_DATA
00070 };
00071 
00072 //
00073 // Sample sentences
00074 // 
00075 const char *sentences[]={
00076         "碓氷峠(うすいとうげ)は群馬県安中市松井田町と長野県北佐久郡軽井沢町との境にある日本の峠である。",
00077         END_OF_DATA
00078 };
00079 
00080 
00081 //
00082 // 
00083 //
00084 OrthographyData data={
00085         "Japanese Kokuji",
00086         "日本国字",
00087         0x5ce0, // Mountain pass, 峠 
00088         values,
00089         "峠栂込榊鴫辻畑柾梻毟",
00090         sentences
00091 };
00092 
00093 const OrthographyData *pData = &data;
00094 
00095 }; // end of namespace
00096 
00097 #endif