我有一个这样的印地文脚本文件:3.भारतकाइतिहासकाफीसमृद्धएवंविस्तृतहै।我必须编写一个程序,为每个句子中的每个单词添加一个位置。因此,特定单词位置的每一行的编号应以括号中的1开头。输出应该是这样的。3.भारत(1)का(2)इतिहास(3)काफी(4)समृद्ध(5)एवं(6)विस्तृत(7)है(8)।(9)上面这句话的意思是:3.Indiahasalongandrichhistory.如果您观察到“।”(印地语中的句号相当于英语中的“.”)也有一个单词位置,类似地,其他特殊符号也会有,因为我正在尝试进行英语-印地语单词对齐(自然语言处理
关闭。这个问题需要更多focused.它目前不接受答案。想改进这个问题吗?更新问题,使其只关注一个问题editingthispost.关闭8年前。Improvethisquestion是否有用于将印地语音译为英语的python库?例如“खाया”应转换为“khaya”
某些语言具有对拉丁字符的公认音译,例如印地语、俄语或日语。例如,用天城文书写的“Themaniseating”的印地语是“आदमीखारहाहै।”。音译为“Aadmikharahahai”。(或类似的东西;这种方法经常在线使用,尤其是当人们无法使用印地语键盘时。)在这种情况下,我们使用的是拉丁文脚本,但仍在编写印地语,因此可以使用lang来标记任一变体。属性:आदमीखारहाहै।或Aadmikharahahai.然后我的问题是关于通常用拉丁字母书写的语言本身,但可能有针对非母语者/学习者的语音指南——国际音标或临时发音——在赋予它语义方面是否有任何最佳实践?例如,在爱尔兰语中,如
某些语言具有对拉丁字符的公认音译,例如印地语、俄语或日语。例如,用天城文书写的“Themaniseating”的印地语是“आदमीखारहाहै।”。音译为“Aadmikharahahai”。(或类似的东西;这种方法经常在线使用,尤其是当人们无法使用印地语键盘时。)在这种情况下,我们使用的是拉丁文脚本,但仍在编写印地语,因此可以使用lang来标记任一变体。属性:आदमीखारहाहै।或Aadmikharahahai.然后我的问题是关于通常用拉丁字母书写的语言本身,但可能有针对非母语者/学习者的语音指南——国际音标或临时发音——在赋予它语义方面是否有任何最佳实践?例如,在爱尔兰语中,如
我创建了以下代码,用于在tcpdf中使用arialunicode字体显示印地文文本$pdf=newTCPDF(PDF_PAGE_ORIENTATION,PDF_UNIT,PDF_PAGE_FORMAT,true,'UTF-8',false);//setdefaultmonospacedfont$pdf->SetDefaultMonospacedFont(PDF_FONT_MONOSPACED);//setsomelanguage-dependentstrings$pdf->setLanguageArray($l);//----------------------------------
我创建了以下代码,用于在tcpdf中使用arialunicode字体显示印地文文本$pdf=newTCPDF(PDF_PAGE_ORIENTATION,PDF_UNIT,PDF_PAGE_FORMAT,true,'UTF-8',false);//setdefaultmonospacedfont$pdf->SetDefaultMonospacedFont(PDF_FONT_MONOSPACED);//setsomelanguage-dependentstrings$pdf->setLanguageArray($l);//----------------------------------
我正在使用PHP和MySQL申请。问题是:如何在MySQL中存储数据नवीनखेतिहरउपकरण।可读格式或निलेसरपà¥à¤¬格式当用户在文本框中输入数据并点击提交时,我们会得到不同格式的数据。我们需要做什么转换并存储在MySQL以可读的格式。 最佳答案 选择utf8字符集和utf8_general_ci排序规则。显然,字段(您要存储印地语文本)的排序规则应该是utf8_general_ci。要更改表格字段,请运行ALTERTABLE``CHANGE````VARCHAR(100)CHARSETu
我正在使用PHP和MySQL申请。问题是:如何在MySQL中存储数据नवीनखेतिहरउपकरण।可读格式或निलेसरपà¥à¤¬格式当用户在文本框中输入数据并点击提交时,我们会得到不同格式的数据。我们需要做什么转换并存储在MySQL以可读的格式。 最佳答案 选择utf8字符集和utf8_general_ci排序规则。显然,字段(您要存储印地语文本)的排序规则应该是utf8_general_ci。要更改表格字段,请运行ALTERTABLE``CHANGE````VARCHAR(100)CHARSETu
我有一个名为“hindi.txt”的文件。它的内容如下。我正在使用Python3.5。कामकाजीमहिलाओंकेलिएदेशमेंदिल्लीअसुरक्षित,सिक्किमसबसेबेहतर:रिपोर्ट9सालसेअटकीराफेलडीलमंजूर,59000Crमेंभारतखरीदेगा36फाइटरप्लेनWhatsAppकोटक्करदेनेआर्टिफिशियलइंटेलिजेंसकेसाथआयागूगलकाAlloमैसेंजरउड़ीहमलेपर10खुलासे:आर्मीबेसमें150मीटरअंदरतकघुसआएथेजैशकेआतंकीउड़ीहम
我有一个名为“hindi.txt”的文件。它的内容如下。我正在使用Python3.5。कामकाजीमहिलाओंकेलिएदेशमेंदिल्लीअसुरक्षित,सिक्किमसबसेबेहतर:रिपोर्ट9सालसेअटकीराफेलडीलमंजूर,59000Crमेंभारतखरीदेगा36फाइटरप्लेनWhatsAppकोटक्करदेनेआर्टिफिशियलइंटेलिजेंसकेसाथआयागूगलकाAlloमैसेंजरउड़ीहमलेपर10खुलासे:आर्मीबेसमें150मीटरअंदरतकघुसआएथेजैशकेआतंकीउड़ीहम