Freepascal: Unterschied zwischen den Versionen

Aus OrgaMon Wiki
Zur Navigation springen Zur Suche springen
Zeile 42: Zeile 42:
=== AnsiUpperCase ===
=== AnsiUpperCase ===


* Funktioniert in Freepascal nicht
* die Funktionen AnsiUpperCase und AnsiLowerCase arbeiten in Freepascal nicht mit ü und unzähligen anderen "special chars", diese Zeichen bleiben einfach unberührt
* https://en.wikipedia.org/wiki/ISO/IEC_8859
* Workaround 1:
* Ev. Mappings selbst erstellen mit https://unicode.org/Public/MAPPINGS/ISO8859/
 
 
function AnsiUpperCase(const S: string): string;
begin
  if length(s)>0 then
    begin
      result:=s;
      UniqueString(result);
      CharUpperBuffA(pchar(result),length(result));
    end
  else
    result:='';
end;
 
* Workaround 2
* Ich habe ein Programm geschrieben, das aus den "offiziellen" Charset- Beschreibungen 2 Look-Up-Tabellen zur Umkodierung erstellt (eine für LowerCase, eine für UpperCase)
** https://en.wikipedia.org/wiki/ISO/IEC_8859
** https://unicode.org/Public/MAPPINGS/ISO8859/
* Ich habe auf AVX, SIMD, SSE oder andere Dinge gehofft die mit Look-Up-Tabellen helfen, kam in der Recherche aber nicht weiter
** SSE oder AVX verwenden? Also wir haben eine 8-Bit Look up table LUT[0..255]
** SSE oder AVX verwenden? Also wir haben eine 8-Bit Look up table LUT[0..255]


  l := length(S);
# Lookup Table, LUT = 256 Bytes (2048 Bit)
# src, der Ausgangsstrin liefert mit jedem Char den Index (8 Bit Index) für die Look-Up-Tabelle. Mit diesem Index wird LUT ausgelesen, das ist das neue Zeichen. In vielen Fällen
# gibt es keine Änderung, z.B. "A" bleibt "A". Aus Performanche-Gründen interessieren diese Details aber nicht
const
  LUT 
  {ANSI_8859_15_Upper} : array[0..255] of char = (#$00, #$01,
  #$02, #$03, #$04, #$05, #$06, #$07, #$08, #$09, #$0A, #$0B, #$0C, #$0D, #$0E, #$0F, #$10, #$11,
  #$12, #$13, #$14, #$15, #$16, #$17, #$18, #$19, #$1A, #$1B, #$1C, #$1D, #$1E, #$1F, #$20, #$21,
  #$22, #$23, #$24, #$25, #$26, #$27, #$28, #$29, #$2A, #$2B, #$2C, #$2D, #$2E, #$2F, #$30, #$31,
  #$32, #$33, #$34, #$35, #$36, #$37, #$38, #$39, #$3A, #$3B, #$3C, #$3D, #$3E, #$3F, #$40, #$41,
  #$42, #$43, #$44, #$45, #$46, #$47, #$48, #$49, #$4A, #$4B, #$4C, #$4D, #$4E, #$4F, #$50, #$51,
  #$52, #$53, #$54, #$55, #$56, #$57, #$58, #$59, #$5A, #$5B, #$5C, #$5D, #$5E, #$5F, #$60, {#$61->}#$41,
  {#$62->}#$42, {#$63->}#$43, {#$64->}#$44, {#$65->}#$45, {#$66->}#$46, {#$67->}#$47, {#$68->}#$48, {#$69->}#$49, {#$6A->}#$4A, {#$6B->}#$4B, {#$6C->}#$4C, {#$6D->}#$4D, {#$6E->}#$4E, {#$6F->}#$4F, {#$70->}#$50, {#$71->}#$51,
  {#$72->}#$52, {#$73->}#$53, {#$74->}#$54, {#$75->}#$55, {#$76->}#$56, {#$77->}#$57, {#$78->}#$58, {#$79->}#$59, {#$7A->}#$5A, #$7B, #$7C, #$7D, #$7E, #$7F, #$80, #$81,
  #$82, #$83, #$84, #$85, #$86, #$87, #$88, #$89, #$8A, #$8B, #$8C, #$8D, #$8E, #$8F, #$90, #$91,
  #$92, #$93, #$94, #$95, #$96, #$97, #$98, #$99, #$9A, #$9B, #$9C, #$9D, #$9E, #$9F, #$A0, #$A1,
  #$A2, #$A3, #$A4, #$A5, #$A6, #$A7, {#$A8->}#$A6, #$A9, #$AA, #$AB, #$AC, #$AD, #$AE, #$AF, #$B0, #$B1,
  #$B2, #$B3, #$B4, #$B5, #$B6, #$B7, {#$B8->}#$B4, #$B9, #$BA, #$BB, #$BC, {#$BD->}#$BC, #$BE, #$BF, #$C0, #$C1,
  #$C2, #$C3, #$C4, #$C5, #$C6, #$C7, #$C8, #$C9, #$CA, #$CB, #$CC, #$CD, #$CE, #$CF, #$D0, #$D1,
  #$D2, #$D3, #$D4, #$D5, #$D6, #$D7, #$D8, #$D9, #$DA, #$DB, #$DC, #$DD, #$DE, #$DF, {#$E0->}#$C0, {#$E1->}#$C1,
  {#$E2->}#$C2, {#$E3->}#$C3, {#$E4->}#$C4, {#$E5->}#$C5, {#$E6->}#$C6, {#$E7->}#$C7, {#$E8->}#$C8, {#$E9->}#$C9, {#$EA->}#$CA, {#$EB->}#$CB, {#$EC->}#$CC, {#$ED->}#$CD, {#$EE->}#$CE, {#$EF->}#$CF, {#$F0->}#$D0, {#$F1->}#$D1,
  {#$F2->}#$D2, {#$F3->}#$D3, {#$F4->}#$D4, {#$F5->}#$D5, {#$F6->}#$D6, #$F7, {#$F8->}#$D8, {#$F9->}#$D9, {#$FA->}#$DA, {#$FB->}#$DB, {#$FC->}#$DC, {#$FD->}#$DD, {#$FE->}#$DE, {#$FF->}#$BE);
  l := length(src);
  SetLength(result,l);
  SetLength(result,l);
  for n := 1 to l do
  for n := 1 to l do
   result[n] := LUT[ord(Str[n])]
   result[n] := LUT[ord(src[n])]
Lookup Table = 256 Bytes (2048 Bit)
Str liefert in jedem Byte den Index (8 Bit Index) für den neuen Wert


== Spracherweiterungen ==
== Spracherweiterungen ==

Version vom 27. Januar 2024, 13:25 Uhr

Freepascal oder fpc ist ein freier Pascal-Compiler. Es gibt Bemühungen zu Delphi(tm) kompatibel zu bleiben, aber Freepascal erscheint zunehmend innovativer zu sein.

OrgaMon verwendet Freepascal für die Linux-Server-Seite des OrgaMon in den Projekten keepcon, domadd, cOrgaMon und natürlich Polyzalos. lOrgaMon wird unter Windows mit der Entwicklungsumgebung Lazarus entwickelt.

Installation

  • Für OpenSuse sollten ausschliesslich für diese Plattform compilierte Pakete verwendet werden. Das Standard 64-Bit Paket von Sourceforge wird nicht laufen!
#
# Option 1: aus "Factory"
#
zypper ar --refresh http://download.opensuse.org/repositories/devel:/languages:/pascal/openSUSE_Factory/devel:languages:pascal.repo

#
# Option 2: aus "42.1"
#
zypper ar --refresh http://download.opensuse.org/repositories/devel:languages:pascal/openSUSE_Leap_42.1/devel:languages:pascal.repo

#
# ein erstmaliger Download des Repository-Index, dem "Key" kann man mit 
# Taste <A> dauerhaft vertrauen
#
zypper refresh
#
# die eigentliche Installation
#
zypper install lazarus

Unterschiede

FileAge(FileName: UnicodeString; out LastWrite: TDateTime): boolean

  • Delphi liefert einen abgeschnittenen ms Wert, also :19 s
  • Freepascal liefert einen gerundeten s Wert, also :20 s

AnsiUpperCase

  • die Funktionen AnsiUpperCase und AnsiLowerCase arbeiten in Freepascal nicht mit ü und unzähligen anderen "special chars", diese Zeichen bleiben einfach unberührt
  • Workaround 1:


function AnsiUpperCase(const S: string): string;
begin
 if length(s)>0 then
   begin
     result:=s;
     UniqueString(result);
     CharUpperBuffA(pchar(result),length(result));
   end
 else
   result:=;
end;
  • Workaround 2
  • Ich habe ein Programm geschrieben, das aus den "offiziellen" Charset- Beschreibungen 2 Look-Up-Tabellen zur Umkodierung erstellt (eine für LowerCase, eine für UpperCase)
  • Ich habe auf AVX, SIMD, SSE oder andere Dinge gehofft die mit Look-Up-Tabellen helfen, kam in der Recherche aber nicht weiter
    • SSE oder AVX verwenden? Also wir haben eine 8-Bit Look up table LUT[0..255]
# Lookup Table, LUT = 256 Bytes (2048 Bit)
# src, der Ausgangsstrin liefert mit jedem Char den Index (8 Bit Index) für die Look-Up-Tabelle. Mit diesem Index wird LUT ausgelesen, das ist das neue Zeichen. In vielen Fällen
# gibt es keine Änderung, z.B. "A" bleibt "A". Aus Performanche-Gründen interessieren diese Details aber nicht

const
 LUT  
 {ANSI_8859_15_Upper} : array[0..255] of char = (#$00, #$01,
 #$02, #$03, #$04, #$05, #$06, #$07, #$08, #$09, #$0A, #$0B, #$0C, #$0D, #$0E, #$0F, #$10, #$11,
 #$12, #$13, #$14, #$15, #$16, #$17, #$18, #$19, #$1A, #$1B, #$1C, #$1D, #$1E, #$1F, #$20, #$21,
 #$22, #$23, #$24, #$25, #$26, #$27, #$28, #$29, #$2A, #$2B, #$2C, #$2D, #$2E, #$2F, #$30, #$31,
 #$32, #$33, #$34, #$35, #$36, #$37, #$38, #$39, #$3A, #$3B, #$3C, #$3D, #$3E, #$3F, #$40, #$41,
 #$42, #$43, #$44, #$45, #$46, #$47, #$48, #$49, #$4A, #$4B, #$4C, #$4D, #$4E, #$4F, #$50, #$51,
 #$52, #$53, #$54, #$55, #$56, #$57, #$58, #$59, #$5A, #$5B, #$5C, #$5D, #$5E, #$5F, #$60, {#$61->}#$41,
 {#$62->}#$42, {#$63->}#$43, {#$64->}#$44, {#$65->}#$45, {#$66->}#$46, {#$67->}#$47, {#$68->}#$48, {#$69->}#$49, {#$6A->}#$4A, {#$6B->}#$4B, {#$6C->}#$4C, {#$6D->}#$4D, {#$6E->}#$4E, {#$6F->}#$4F, {#$70->}#$50, {#$71->}#$51,
 {#$72->}#$52, {#$73->}#$53, {#$74->}#$54, {#$75->}#$55, {#$76->}#$56, {#$77->}#$57, {#$78->}#$58, {#$79->}#$59, {#$7A->}#$5A, #$7B, #$7C, #$7D, #$7E, #$7F, #$80, #$81,
 #$82, #$83, #$84, #$85, #$86, #$87, #$88, #$89, #$8A, #$8B, #$8C, #$8D, #$8E, #$8F, #$90, #$91,
 #$92, #$93, #$94, #$95, #$96, #$97, #$98, #$99, #$9A, #$9B, #$9C, #$9D, #$9E, #$9F, #$A0, #$A1,
 #$A2, #$A3, #$A4, #$A5, #$A6, #$A7, {#$A8->}#$A6, #$A9, #$AA, #$AB, #$AC, #$AD, #$AE, #$AF, #$B0, #$B1,
 #$B2, #$B3, #$B4, #$B5, #$B6, #$B7, {#$B8->}#$B4, #$B9, #$BA, #$BB, #$BC, {#$BD->}#$BC, #$BE, #$BF, #$C0, #$C1,
 #$C2, #$C3, #$C4, #$C5, #$C6, #$C7, #$C8, #$C9, #$CA, #$CB, #$CC, #$CD, #$CE, #$CF, #$D0, #$D1,
 #$D2, #$D3, #$D4, #$D5, #$D6, #$D7, #$D8, #$D9, #$DA, #$DB, #$DC, #$DD, #$DE, #$DF, {#$E0->}#$C0, {#$E1->}#$C1,
 {#$E2->}#$C2, {#$E3->}#$C3, {#$E4->}#$C4, {#$E5->}#$C5, {#$E6->}#$C6, {#$E7->}#$C7, {#$E8->}#$C8, {#$E9->}#$C9, {#$EA->}#$CA, {#$EB->}#$CB, {#$EC->}#$CC, {#$ED->}#$CD, {#$EE->}#$CE, {#$EF->}#$CF, {#$F0->}#$D0, {#$F1->}#$D1,
 {#$F2->}#$D2, {#$F3->}#$D3, {#$F4->}#$D4, {#$F5->}#$D5, {#$F6->}#$D6, #$F7, {#$F8->}#$D8, {#$F9->}#$D9, {#$FA->}#$DA, {#$FB->}#$DB, {#$FC->}#$DC, {#$FD->}#$DD, {#$FE->}#$DE, {#$FF->}#$BE);

l := length(src);
SetLength(result,l);
for n := 1 to l do
 result[n] := LUT[ord(src[n])]

Spracherweiterungen

  • hier fasse ich einige Spracherweiterungen auf, die mir so einfallen
  • Intel Parallel Building Blocks (PBB)
  • OpenMP
  • Ev. kommt mir hier das kommende LLVM Target von FreePascal zugute

"param" anstelle von "var"

var
 MomentTimeout : ANFiXDate; Parameter;
 c,i,r : integer; Parameter;
 
begin
   // all zu alte Einträge löschen
   MomentTimeout := DatePlus(DateGet, -10);
   i := 0;
   c := colOf('MOMENT');
   for r := RowCount downto 1 do
     if (StrToIntDef(readCell(r, c), 0) < MomentTimeout) then
     begin
       del(r);
       inc(i);
     end;
   if (i > 0) then
     Log('INFO: ' + 'gebe ' + inttostr(i) +
       ' Dateieinträge frei, da sie älter als 10 Tage sind');
end;

"param" Variable sind wie "var" Variable, die aber erst gesetzt werden, wenn ein (erster) lesender Zugriff erfolgt. Das "Setzen" des VAriablen-Wertes erfolgt gar nicht, an dieser Stelle wird kein Code ausgeführt, erst beim ersten Vergleich wird "MomentTimeout" gesetzt. Danach wird MomentTimeout wie eine normale Variable verwendet. Dadurch lässt sich der Code übersichtlicher gestalten. Man kann die "gathering" Phase schön beisammenhalten - auch wenn die die Kosten hoch sind. Es wird jedoch keine Zeit verbraten, und eine Menge komplexe if-Bedingungen gespart.

nebenläufige Zuweisung

var
 a,b : integer; Concurrent;

begin
 a := sql('count SOULS from EARTH');
 b := sql('count STARS from UNIVERSE');
 if (a>=b) then
   beep;
end;

Die Zuweisung nach a erfolgt in einem eigenen Thread. DIe Codeausführung wird sofort mit der nächsten Zeile fortgesetzt. Auch für die Zuweisung zu b wird ein Thread gestartet. Erst bei einem lesenden Zugriff auf a oder b wird auf das Ergebnis (= Beendigung des Threads) gewartet, ein erneuter schreibender ZUgriff auf a oder b würde den Thread ohne Warten auf das Ergebnis abbrechen.

case statement

  • fpc\compiler\x86_64\nx64set.pas Line 63 ff
  • Optimierung nur bei -Os, (=size), ich halte aber auch "speed" für ein Argument

Es ist eine Optimierung beim Freepascal Case Statement möglich, wenn z.B. anhand eines enum-Types unterschieden werden soll:

  • die Optimierung für bei einer Hohen Granularität sind keiner erhöhten Code Grösse
    • Beispiel, ein Range verschlechtert die Granularität 99..110 würde 12 JMP Table Einträge erzeugen!
  • bei wesentlichen Lücken im case Statement würden viele "NOP"-Einträge entstehen
    • case n of 0: 20: else end; es würden für 1..19 "Lücken" entstehen, die alle nach "else" springen
  • Linear-Verschiebung, Normalisierung: case n -2: -1: 0: 1: 2: end; muss normalisiert werden auf 0: .. 4: ohne "n" zu ändern
  • case statement ohne "ranges", also KEIN 0..18
  • case statement ohne nennenswerte Lücken
JMP [Table+AX*8]


.GLOBAL calculate
calculate:
   pushl %ebp
   movl %esp,%ebp
   movl 12(%ebp),%eax
   movl 8(%ebp),%ecx
   cmpl $2,%ecx
   ja done
   jmp *operations(,%ecx,4)
operation1:
   imull %eax,%eax
   jmp done
operation2:
   negl %eax
   jmp done
operation3:
   addl $0x80,%eax
done:
   leave
   ret
operations:
   .long operation1, operation2, operation3

my way would be (assumed 64-bit mode yet):
;entry in rax and all entries contain a valid address
;a limit check here may not hurt much.

 jmp [table+rax*8]            ;if in the data-seg or
 jmp cs:[table+rax*8]         ;if the table is part of the code section
;also possible if your compiler is able to:
 jmp [rip+table_offset+rax*8] ;RIP access uses CS by default

__
wolfgang


The code I posted here first was a test-case-stand-alone example that
I constructed so I could learn how to write jump tables. In the end
though I am looking to include an assembly function into a library
which is built in a static and a dynamic version using libtool and
autoconf/automake. As I mentioned on linux-assembly, the linker was
complaining about my jump table telling me that it can't relocate some
symbols. I used a C program with a large switch statement and gcc with
-fPIC to see how to deal with PIC and am using the version below now.
Just as gcc does, I placed the jump table in .section .rodata, but I
am not sure if that's equivalent to placing it in the .data section or
not.

 .text
 .global jump_table
 .type jump_table, @function

jump_table:
 # Push stack pointer so we can make room for local storage.
 push %rax

 mov $0x02, %rax # Move index into rax; 2 is supposed to end up at
label_02.

 lea 0(,%rax, 4), %rdx
 lea table(%rip), %rax
 mov (%rdx, %rax), %edx
 movslq %edx, %rdx
 lea table(%rip), %rax
 lea (%rdx, %rax), %rax
 jmp *%rax

 .section .rodata
 .align 4
table:
 .long label_00-table
 .long label_01-table
 .long label_02-table
 .long label_03-table

 .text
label_00:
 jmp done

label_01:
 jmp done

label_02:
 jmp done

label_03:
 jmp done

done:
 pop %rax
 ret

 .size jump_table, .-jump_table


  • fpc\tests\webtbs\tw10641.pp (Jumptable)
  • fpc\tests\webtbs\tw3577.pp (Jumptable)
  • fpc\tests\webtbs\tw11638.pp (Code-Länge des JMP)


Umsetzungsprobleme

  • ich habe keine Möglichkeit im Assembler mir zu wünschen dass immer ein far-Jump mit 5 Bytes erstellt wird, es wird optimiert und zwar ensteht bein kurzen Jumps ein 2 Byte grosser Befehl
  • will ich den Befehl selbst codieren, dann ensteht 2 neue Probleme:
    • DB $e9,$72,$00,$00,$00 also ich bekomme das $7 nicht hin (dieses Bit ist vorgegeben)
    • DB $e9
    • DB $70|(@there-@here) // 1. Problem: binäres oder? 2.Problem: Minus Operation
#$66#$66#$0F#$1F#$84#$00#$00#$00#$00#$00 -> data16 nop WORD PTR [rax+rax*1+0x0]
#$66#$2e#$0f#$1f#$84#$00#$00#$00#$00#$00 -> nop WORD PTR cs:[rax+rax*1+0x0]

Die "long" NOPs :

Beispiel

; Example 3.12. switch with relative pointers, 64 bit, YASM syntax
SECTION .data
jumptable: dd case1-jumptable, case2-jumptable, case3-jumptable
SECTION .text
default rel ; use relative addresses
funcb: ; This function implements a switch statement
mov eax, [rsp+8] ; function parameter
cmp eax, 3
jnb case_default ; index out of range
lea rdx, [jumptable] ; address of table
movsxd rax, dword [rdx+rax*4] ; read table entry
; The jump addresses are relative to jumptable, get absolute address:
add rax, rdx
jmp rax ; jump to desired case
case1: ...
ret
case2: ...
ret
case3: ...
ret
case_default:
...
ret

relevante Projekte