[liblouis-liblouisxml] Re: UEB number sign followed by a non-digit.

  • From: "Rasmussen, Lloyd" <lras@xxxxxxx>
  • To: "'liblouis-liblouisxml@xxxxxxxxxxxxx'" <liblouis-liblouisxml@xxxxxxxxxxxxx>
  • Date: Fri, 10 Jun 2016 16:38:15 -0400

If this is to be considered as braille to be back-translated, the number sign 
(hash) should have been input as braille 4-5-6, braille 1-4-5-6. After I go 
home I'll see what Duxbury does to this string. The output you got may be 
correct, because the number sign puts you into numeric mode, and I'm not sure 
which characters terminate numeric mode. 

Lloyd Rasmussen, Senior Staff Engineer
National Library Service for the Blind and Physically Handicapped, Library of 
Congress
Washington, DC 20542   202-707-0535
http://www.loc.gov/nls/
The preceding opinions are my own and do not necessarily reflect those of the 
Library of Congress, NLS.


-----Original Message-----
From: liblouis-liblouisxml-bounce@xxxxxxxxxxxxx 
[mailto:liblouis-liblouisxml-bounce@xxxxxxxxxxxxx] On Behalf Of Dave Mielke
Sent: Friday, June 10, 2016 4:28 PM
To: LibLouis
Subject: [liblouis-liblouisxml] UEB number sign followed by a non-digit.

I'm having to deal with what's admittedly an odd case, but am hoping there's a 
solution for it. It's occurring when back-translating UEB, and the number sign 
is followed by characters that don't belong there.

A simplified example would be the braille characters: ⠼⠞⠽⠏⠑

In case the five braille characters in this example aren't displaying for you, 
they are the number sign (dots 3456) followed by the word "type".

This is clearly invalid so, of course, liblouis isn't at fault for not handling 
it the way I wish it would. What I'm asking, though, is if there's a rule (or 
set of rules) that I could add in order to get it to do what I wish it would.

What is does is back-translate it to the four characters "typ5". The number 
sign disappears (as it should). The first three letters (typ), because they 
don't correspond to digits, are translated as letters. The last letter (e), 
because it corresponds to the digit 5, is translated to that digit.

What I'm hoping can be done is to add a rule (or rules) so that the number sign 
will still disappear, but that it'll lose its special meaning if the first 
character after it isn't a digit so that, in this example, the "e" will be 
translated to an "e" rather than to a "5".

Can this be done?

-- 
Dave Mielke           | 2213 Fox Crescent | The Bible is the very Word of God.
Phone: 1-613-726-0014 | Ottawa, Ontario   | http://Mielke.cc/bible/
EMail: Dave@xxxxxxxxx | Canada  K2A 1H7   | http://FamilyRadio.org/
For a description of the software, to download it and links to project pages go 
to http://liblouis.org

Other related posts: