[liblouis-liblouisxml] Re: SV: Re: SV: Re: SV: Corrections pass during back translation.

  • From: Bert Frees <bertfrees@xxxxxxxxx>
  • To: "liblouis-liblouisxml@xxxxxxxxxxxxx" <liblouis-liblouisxml@xxxxxxxxxxxxx>
  • Date: Wed, 11 Jan 2017 12:09:26 +0100

2017-01-11 11:46 GMT+01:00 Bue Vester-Andersen <bue@xxxxxxxxxxxxxxxxxx>:

You are right, of course. The important thing is that the feature is
there, no matter what we call the opcodes. However, I think it would create
some confusion of terms. And the same opcode would be used with quite
different syntax depending on whether it was used for forward or backward
translation. Also, we would then have to ensure that a given multi-pass
rule is defined explicitly for either translation or back-translation, not
both, even in the cases where it might be relevant to use a rule both ways.



Yes, that was the idea. See previous emails. My theory is that there are
never cases where a rule should be used both ways.


I think I understand what you mean, but I also think it makes sense saying
that translation goes through pass 0-1-2-3-4, and back-translation goes
through the same passes in the reverse order. Otherwise, we should probably
call the opcodes something differently to distinguish between them, but I
have no good ideas at the moment J



Personally I find the names a bit odd in a way in the case of
backtranslation because they don't do what they say. If you have a rule
that is called "pass2", you would think that it is done in a second pass,
right? Regardless of whether you're translating characters to dots or dots
to characters. (Or in other words: "pass" says something about the
algorithm, not the braille code.)

My idea was that if the pass2-4 rules have an obligatory prefix,
distinguishing them is not a problem anymore. You would have:

    fw pass2 ... ...

or:

    bw pass2 ... ...



I don't know... Just thinking out loud here.





Bue





*Fra:* liblouis-liblouisxml-bounce@xxxxxxxxxxxxx [mailto:
liblouis-liblouisxml-bounce@xxxxxxxxxxxxx] *På vegne af *Bert Frees
*Sendt:* 11. januar 2017 11:04
*Til:* liblouis-liblouisxml@xxxxxxxxxxxxx
*Emne:* [liblouis-liblouisxml] Re: SV: Re: SV: Corrections pass during
back translation.



But couldn't you do that pre-processing in a correct pass, if that would
become the very first pass (and dots-to-dots)?



2017-01-11 11:01 GMT+01:00 Bue Vester-Andersen <bue@xxxxxxxxxxxxxxxxxx>:

Hi,



I, for one, need to use pass2 before the actual backtranslation. One
example is to correct the way capsword is used and what characters cancels
it.



So, I would have real problems, if pass2-3-4 were put after the
back-translation in stead of before.



Apart from that, I agree that the same multi-pass rules would probably
almost never work for both forward and backward translation. This is why I
am currently splitting up my 6-dots tables in tables for forward and
backward translation, and I will probably have to do the same with 8-dots,
unless nofor and noback get to work with the multi-pass opcodes.

Bue





*Fra:* liblouis-liblouisxml-bounce@xxxxxxxxxxxxx [mailto:
liblouis-liblouisxml-bounce@xxxxxxxxxxxxx] *På vegne af *Bert Frees
*Sendt:* 11. januar 2017 10:49
*Til:* liblouis-liblouisxml@xxxxxxxxxxxxx
*Emne:* [liblouis-liblouisxml] Re: SV: Corrections pass during back
translation.



I wonder if it would make more sense to apply backwards pass2, 3 and 4 in
that order and after the regular rules instead of before. This way they
would become "cc" (character-to-character) rules. They could then deal with
cases where back translation gets it wrong.

This of course only makes sense if the backwards passes 2-4 are seen as
completely separate passes specific to the backward translation, and not as
exact counterparts of the forward passes. So the question is: do forward
passes 2-4 need exact counterparts? In other words, do we really want to
perform the backward translation through exactly the same path as the
forward translation but in reverse?

I don't think that context rules are applied in backward translation. That
wouldn't make any sense would it? (Looking at the code confirms this.)





2017-01-11 10:35 GMT+01:00 Bue Vester-Andersen <bue@xxxxxxxxxxxxxxxxxx>:

Hi,

I agree with Dave. One example where the correct opcode is useful during
back-translation is words with accented letters. In many languages, foreign
letters with unusual accents are marked with a special accent mark.
However,
since there is usually only one accent mark to choose from, it has to cover
many different accents with the same letter, which can be a problem during
back-translation. In these cases, the "correct" opcode can help improve
back-translation of words that use these accented letters.

The "correct" opcodes is a characters-to-characters opcode both ways, so it
should be possible to implement the test part in the same manner in both
forward and backward translation.

The same goes for pass2-3-4, which are dots-to-dots opcodes both ways.

The problem is the "context" opcode, which is characters-to-dots one way
and
dots-to-characters the other way. So, it would have to work differently in
forward and backward translation. For back-translation, I would suggest
implementing the test part using the same implementation as for pass2-4.

Hope it makes sense.

Bue


-----Oprindelig meddelelse-----
Fra: liblouis-liblouisxml-bounce@xxxxxxxxxxxxx
[mailto:liblouis-liblouisxml-bounce@xxxxxxxxxxxxx] På vegne af Dave Mielke
Sendt: 11. januar 2017 06:04
Til: liblouis-liblouisxml@xxxxxxxxxxxxx
Emne: [liblouis-liblouisxml] Corrections pass during back translation.

Someone asked if the corrections pass during back translation makes sense
or
if it should be removed. My opinion is that it should be retained to deal


with cases where back translation gets it wrong.


Other related posts: