[liblouis-liblouisxml] Some Translation/Back Translation Issues

  • From: "Jennifer Dunnam" <jennifer.dunnam1829@xxxxxxxxx>
  • To: <liblouis-liblouisxml@xxxxxxxxxxxxx>
  • Date: Sun, 8 Oct 2017 17:06:34 -0500

Good afternoon,

 

It has been wonderful to see all of the improvements in the way UEB is
handled in Liblouis. Kudos to all who have worked on this so that braille
users can read and write with accuracy!

 

Following are some more issues I have encountered when using several
software packages that utilize Liblouis for braille translation. Please let
me know if anything needs clarification.

 

• The Em-dash — (U+2014) is displaying incorrectly. This is a
frequently-occurring character used in most cases where a "dash" is
intended.  In the UEB symbols list (Appendix 3, page 314), this specific
Unicode character is called "dash" and is specifically defined in braille as
dots 6, 36. Liblouis is displaying it as dots 5, 6, 36. The three cell
symbol dots 5, 6, 36 is specifically linked in appendix 3 of the rulebook
(page 308) to the "long dash" (horizontal bar) U+2015. Liblouis is
displaying u+2015 correctly.

 

• The "dis" groupsign is incorrectly being used in the words "disc" and
"dish". I believe this has already been reported, but let me know if more
info would be helpful.  

 

• The word "in" is incorrectly displaying using the "in" lower wordsign when
followed by a semicolon or colon. See the lower sign rule (§10.5.4).
Liblouis is handling this word correctly when it is followed by a period,
comma, exclamation point, or question mark or when surrounded by quotation
marks.

 

• The word "Bethesda" is incorrectly displaying without use of the "be"
groupsign. The UEB rulebook (§10.6.1) states that the "be" groupsign is used
when the letters "be" form the first syllable of the word, as "be" does in
Bethesda according to dictionaries.

 

• The word "Doubleday" is incorrectly displaying using and "ed" groupsign
instead of the "day" final-letter contraction.  A contraction should not
bridge the words which make up an unhyphenated compound word (this includes
proper names as shown in the examples in the rulebook). See §10.11.1.

 

• Back translation: when alphabetic wordsigns or strong wordsigns are
brailled followed by the apostrophe with the letters d, ll, re, s, t, or ve,
they are unexpectedly back translating to print as the single letters rather
than the alphabetic words. For example, "you'd" is coming out as "y'd";
"this'll" is coming out "th'll". See UEB §10.1.2 and 10.2.2. These are
working correctly in Liblouis print-to-braille translation. 

 

• Back translation: When brailling the shortforms for "first" and "quick",
an "apostrophe s" is unexpectedly being added to the back translated word.
The other shortforms seem to be working correctly.

 

• Back translation: When typing a number followed by a nonalphabetic symbol
(plus, minus [u+2212], multiplication, division, greater-than, less-than, or
equals sign), followed by any of the letters a-j, the letter is back
translating as a digit. For example, 2+c when typed correctly in braille is
unexpectedly back translating as 2+3.  The problem is not limited to these
operation signs, but these are the cases in which the concern arises most
prominently. Most nonalphabetic symbols terminate numeric mode so that if a
numeric indicator is not used after them, the following characters should be
translating as letters (with no intervening grade 1 indicator needed). See
UEB §6.3.1. This is working correctly in translation from print to braille,
just not in braille-to-print.  

 

Thank you for considering these.

 

Other related posts:

  • » [liblouis-liblouisxml] Some Translation/Back Translation Issues - Jennifer Dunnam