开源语音代码eSpeak1.06 的移植到单片机的过程(二)之分析下speak.c 文件

1. 下面的分析speak.c 文件,不是很理解speak.c   和  espeak.c 的区别,

speak.c  说的是有 text to speech engine. It does not use the libespeak library.

espeak.c 说的是用的是 libespeak library

我理解libespeak library 说的是它

 

如果不使用库的话,应该用的是它

 

但是为啥要搞两个?疑惑

第一个看到的是,说是

char path_home[N_PATH_HOME];    // this is the espeak-data directory

决定使用 espeak.c, 因为库也是C写的,应该也能整的进去。下一个问题,怎么把数据文件放到UIS8910里面?先提单问问。

2. 看下面的代码

                sprintf(name2, "%s ", voicename);
                if(strstr(voices_europe, voicename) != NULL)
                    voice_dir = "europe";
                else if(strstr(voices_asia, voicename) != NULL)
                    voice_dir = "asia";
                else
                    voice_dir = "other";

看下对比的是什么

static const char *voices_asia =   "az bn fa fa-pin hi hy hy-west id ka kn ku ml ms ne pa ta te tr vi vi-hue vi-sgn zh zh-yue ";
static const char *voices_europe =  "an bg bs ca cs cy da de el en en-us es et fi fr fr-be ga hr hu is it lt lv mk nl no pl pt-pt ro ru sk sq sr sv ";

那么 az an是什么,也就是说选择声音的时候,指定的 zh 就是中文,zh-yue 是粤语,那么其他的是 外国的各种语言吗? 其中在 

 

其中 europe 是欧洲, asia 是亚洲,根据选择的字典不同,选择不同的 地区?

3. 查了下不同缩写是不是对应的国家语音,果然是的。

aa Afar
ab Abkhazian
af Afrikaans
am Amharic
ar Arabic
as Assamese
ay Aymara
az Azerbaijani

ba Bashkir
be Byelorussian
bg Bulgarian
bh Bihari
bi Bislama
bn Bengali; Bangla
bo Tibetan
br Breton

ca Catalan
co Corsican
cs Czech
cy Welsh

da Danish
de German
dz Bhutani

el Greek
en English
eo Esperanto
es Spanish
et Estonian
eu Basque

fa Persian
fi Finnish
fj Fiji
fo Faroese
fr French
fy Frisian

ga Irish
gd Scots Gaelic
gl Galician
gn Guarani
gu Gujarati

ha Hausa
he Hebrew (formerly iw)
hi Hindi
hr Croatian
hu Hungarian
hy Armenian

ia Interlingua
id Indonesian (formerly in)
ie Interlingue
ik Inupiak
is Icelandic
it Italian
iu Inuktitut

ja Japanese
jw Javanese

ka Georgian
kk Kazakh
kl Greenlandic
km Cambodian
kn Kannada
ko Korean
ks Kashmiri
ku Kurdish
ky Kirghiz

la Latin
ln Lingala
lo Laothian
lt Lithuanian
lv Latvian, Lettish

mg Malagasy
mi Maori
mk Macedonian
ml Malayalam
mn Mongolian
mo Moldavian
mr Marathi
ms Malay
mt Maltese
my Burmese

na Nauru
ne Nepali
nl Dutch
no Norwegian

oc Occitan
om (Afan) Oromo
or Oriya

pa Punjabi
pl Polish
ps Pashto, Pushto
pt Portuguese

qu Quechua

rm Rhaeto-Romance
rn Kirundi
ro Romanian
ru Russian
rw Kinyarwanda

sa Sanskrit
sd Sindhi
sg Sangho
sh Serbo-Croatian
si Sinhalese
sk Slovak
sl Slovenian
sm Samoan
sn Shona
so Somali
sq Albanian
sr Serbian
ss Siswati
st Sesotho
su Sundanese
sv Swedish
sw Swahili

ta Tamil
te Telugu
tg Tajik
th Thai
ti Tigrinya
tk Turkmen
tl Tagalog
tn Setswana
to Tonga
tr Turkish
ts Tsonga
tt Tatar
tw Twi

ug Uighur
uk Ukrainian
ur Urdu
uz Uzbek

vi Vietnamese
vo Volapuk

wo Wolof

xh Xhosa

yi Yiddish (formerly ji)
yo Yoruba

za Zhuang
zh Chinese
zu Zulu
  

代码继续向下查,可以看到最终会读文件 /espeak-data\voices\asia/zh,所以其他的文件可能是无用的,只需要中文和英文。

                sprintf(buf,"%s%s%c%s", path_voices,voice_dir,PATHSEP,voicename);

                if(GetFileLength(buf) <= 0)
                {
                    // if not found, look in "test" sub-directory
                    sprintf(buf,"%stest%c%s",path_voices,PATHSEP,voicename);
                }
            }
        }
    }
    f_voice = fopen(buf,"r");

 

这个language_type 看不懂什么意思?

5. 在其他地方看到,意思是 中文,女声2

// 设置中文
         espeak_SetVoiceByName("zh+f2"); 

应该在这个地方,f1-f5 是女声,m1m7 是男生,whisper  是耳语,whisperf 是低语。

 

对应的代码在这里

    if(variant_num > 0)
    {
        if(variant_num < 10)
            sprintf(variant_name,"%sm%d",variant_prefix, variant_num);  // male
        else
            sprintf(variant_name,"%sf%d",variant_prefix, variant_num-10);  // female
    }

奇怪,为啥 europe 文件夹里面为啥没有en, en文件反而在上一级目录中???

6. 接下来需要把所有的文件操作换成本地的函数

第一个似乎是写LOG 的函数,开始往下查找,最后是,难道不用?

static FILE *fopen_log(const char *fname,const char *access)

 

static FILE *fopen_log(const char *fname,const char *access)
compile_dictrules
CompileDictionary
espeak_CompileDictionary

if(flag_compile) { // This must be done after the voice is set espeak_CompileDictionary("", stderr, flag_compile & 0x1); exit(0); } case 0x102: // --compile strncpy0(voicename,optarg2,sizeof(voicename)); flag_compile = c; quiet = 1; break; int main (int argc, char **argv)

 

这个文件可能用不到,去掉

 

接下来是,读字段的

int LoadDictionary(Translator *tr, const char *name, int no_error)
{//===============================================================
    int hash;
    char *p;
    int *pw;
    int length;
    //FILE *f;
    unsigned int size;

//    f = fopen(fname,"rb");
//    if((f == NULL) || (size <= 0))
//    {
//        if(no_error == 0)
//        {
//            fprintf(stderr,"Can't read dictionary file: '%s'\n",fname);
//        }
//        return(1);
//    }
    //qhq 修改 *** begin
    int fd = vfs_open(fname, O_RDONLY);
    if (fd < 0)
        return 1;
    //qhq 修改 **** end
    
    tr->data_dictlist = Alloc(size);
    
    
//    size = fread(tr->data_dictlist,1,size,f);
//    fclose(f);
    
    //qhq 修改 *** begin
    ssize_t read_len = vfs_read(fd, tr->data_dictlist, size);
    vfs_close(fd);
    //qhq 修改 **** end
    

接下来是 klatt.c,似乎是网上的一种语音合成工具,有一个宏定义#ifdef INCLUDE_KLATT 

 

遇到一个麻烦的问题,static char *fgets_strip(char *buf, int size, FILE *f_in), 每次读取一行?

还要实现qsort函数,都是linux 里面的?

 

posted @ 2021-06-02 15:05  429512065  阅读(294)  评论(0编辑  收藏  举报