LCOV - differential code coverage report
Current view: top level - contrib/unaccent - unaccent.c (source / functions) Coverage Total Hit UBC CBC EUB ECB
Current: c70b6db34ffeab48beef1fb4ce61bcad3772b8dd vs 06473f5a344df8c9594ead90a609b86f6724cff8 Lines: 85.9 % 185 159 26 159
Current Date: 2025-09-06 07:49:51 +0900 Functions: 100.0 % 10 10 10
Baseline: lcov-20250906-005545-baseline Branches: 63.9 % 122 78 44 78 9 3
Baseline Date: 2025-09-05 08:21:35 +0100 Line coverage date bins:
Legend: Lines:     hit not hit
Branches: + taken - not taken # not executed
(30,360] days: 100.0 % 2 2 2
(360..) days: 85.8 % 183 157 26 157
Function coverage date bins:
(30,360] days: 100.0 % 1 1 1
(360..) days: 100.0 % 9 9 9
Branch coverage date bins:
(30,360] days: 100.0 % 2 2 2
(360..) days: 57.6 % 132 76 44 76 9 3

 Age         Owner                    Branch data    TLA  Line data    Source code
                                  1                 :                : /*-------------------------------------------------------------------------
                                  2                 :                :  *
                                  3                 :                :  * unaccent.c
                                  4                 :                :  *    Text search unaccent dictionary
                                  5                 :                :  *
                                  6                 :                :  * Copyright (c) 2009-2025, PostgreSQL Global Development Group
                                  7                 :                :  *
                                  8                 :                :  * IDENTIFICATION
                                  9                 :                :  *    contrib/unaccent/unaccent.c
                                 10                 :                :  *
                                 11                 :                :  *-------------------------------------------------------------------------
                                 12                 :                :  */
                                 13                 :                : 
                                 14                 :                : #include "postgres.h"
                                 15                 :                : 
                                 16                 :                : #include "catalog/pg_ts_dict.h"
                                 17                 :                : #include "commands/defrem.h"
                                 18                 :                : #include "lib/stringinfo.h"
                                 19                 :                : #include "tsearch/ts_cache.h"
                                 20                 :                : #include "tsearch/ts_locale.h"
                                 21                 :                : #include "tsearch/ts_public.h"
                                 22                 :                : #include "utils/builtins.h"
                                 23                 :                : #include "utils/lsyscache.h"
                                 24                 :                : #include "utils/syscache.h"
                                 25                 :                : 
  164 tgl@sss.pgh.pa.us          26                 :CBC           1 : PG_MODULE_MAGIC_EXT(
                                 27                 :                :                     .name = "unaccent",
                                 28                 :                :                     .version = PG_VERSION
                                 29                 :                : );
                                 30                 :                : 
                                 31                 :                : /*
                                 32                 :                :  * An unaccent dictionary uses a trie to find a string to replace.  Each node
                                 33                 :                :  * of the trie is an array of 256 TrieChar structs; the N-th element of the
                                 34                 :                :  * array corresponds to next byte value N.  That element can contain both a
                                 35                 :                :  * replacement string (to be used if the source string ends with this byte)
                                 36                 :                :  * and a link to another trie node (to be followed if there are more bytes).
                                 37                 :                :  *
                                 38                 :                :  * Note that the trie search logic pays no attention to multibyte character
                                 39                 :                :  * boundaries.  This is OK as long as both the data entered into the trie and
                                 40                 :                :  * the data we're trying to look up are validly encoded; no partial-character
                                 41                 :                :  * matches will occur.
                                 42                 :                :  */
                                 43                 :                : typedef struct TrieChar
                                 44                 :                : {
                                 45                 :                :     struct TrieChar *nextChar;
                                 46                 :                :     char       *replaceTo;
                                 47                 :                :     int         replacelen;
                                 48                 :                : } TrieChar;
                                 49                 :                : 
                                 50                 :                : /*
                                 51                 :                :  * placeChar - put str into trie's structure, byte by byte.
                                 52                 :                :  *
                                 53                 :                :  * If node is NULL, we need to make a new node, which will be returned;
                                 54                 :                :  * otherwise the return value is the same as node.
                                 55                 :                :  */
                                 56                 :                : static TrieChar *
 4086                            57                 :          16712 : placeChar(TrieChar *node, const unsigned char *str, int lenstr,
                                 58                 :                :           const char *replaceTo, int replacelen)
                                 59                 :                : {
                                 60                 :                :     TrieChar   *curnode;
                                 61                 :                : 
 5671 bruce@momjian.us           62         [ +  + ]:          16712 :     if (!node)
 4086 tgl@sss.pgh.pa.us          63                 :            166 :         node = (TrieChar *) palloc0(sizeof(TrieChar) * 256);
                                 64                 :                : 
                                 65         [ -  + ]:          16712 :     Assert(lenstr > 0);          /* else str[0] doesn't exist */
                                 66                 :                : 
 5863 teodor@sigaev.ru           67                 :          16712 :     curnode = node + *str;
                                 68                 :                : 
 4086 tgl@sss.pgh.pa.us          69         [ +  + ]:          16712 :     if (lenstr <= 1)
                                 70                 :                :     {
 5671 bruce@momjian.us           71         [ -  + ]:           5322 :         if (curnode->replaceTo)
 4086 tgl@sss.pgh.pa.us          72         [ #  # ]:UBC           0 :             ereport(WARNING,
                                 73                 :                :                     (errcode(ERRCODE_CONFIG_FILE_ERROR),
                                 74                 :                :                      errmsg("duplicate source strings, first one will be used")));
                                 75                 :                :         else
                                 76                 :                :         {
 5863 teodor@sigaev.ru           77                 :CBC        5322 :             curnode->replacelen = replacelen;
 4086 tgl@sss.pgh.pa.us          78                 :           5322 :             curnode->replaceTo = (char *) palloc(replacelen);
 5863 teodor@sigaev.ru           79                 :           5322 :             memcpy(curnode->replaceTo, replaceTo, replacelen);
                                 80                 :                :         }
                                 81                 :                :     }
                                 82                 :                :     else
                                 83                 :                :     {
 4086 tgl@sss.pgh.pa.us          84                 :          11390 :         curnode->nextChar = placeChar(curnode->nextChar, str + 1, lenstr - 1,
                                 85                 :                :                                       replaceTo, replacelen);
                                 86                 :                :     }
                                 87                 :                : 
 5863 teodor@sigaev.ru           88                 :          16712 :     return node;
                                 89                 :                : }
                                 90                 :                : 
                                 91                 :                : /*
                                 92                 :                :  * initTrie  - create trie from file.
                                 93                 :                :  *
                                 94                 :                :  * Function converts UTF8-encoded file into current encoding.
                                 95                 :                :  */
                                 96                 :                : static TrieChar *
 2867 peter_e@gmx.net            97                 :              2 : initTrie(const char *filename)
                                 98                 :                : {
 4483 bruce@momjian.us           99                 :              2 :     TrieChar   *volatile rootTrie = NULL;
 5863 teodor@sigaev.ru          100                 :              2 :     MemoryContext ccxt = CurrentMemoryContext;
                                101                 :                :     tsearch_readline_state trst;
                                102                 :                :     volatile bool skip;
                                103                 :                : 
                                104                 :              2 :     filename = get_tsearch_config_filename(filename, "rules");
                                105         [ -  + ]:              2 :     if (!tsearch_readline_begin(&trst, filename))
 5863 teodor@sigaev.ru          106         [ #  # ]:UBC           0 :         ereport(ERROR,
                                107                 :                :                 (errcode(ERRCODE_CONFIG_FILE_ERROR),
                                108                 :                :                  errmsg("could not open unaccent file \"%s\": %m",
                                109                 :                :                         filename)));
                                110                 :                : 
                                111                 :                :     do
                                112                 :                :     {
                                113                 :                :         /*
                                114                 :                :          * pg_do_encoding_conversion() (called by tsearch_readline()) will
                                115                 :                :          * emit exception if it finds untranslatable characters in current
                                116                 :                :          * locale. We just skip such lines, continuing with the next.
                                117                 :                :          */
 5863 teodor@sigaev.ru          118                 :CBC           2 :         skip = true;
                                119                 :                : 
                                120         [ +  - ]:              2 :         PG_TRY();
                                121                 :                :         {
                                122                 :                :             char       *line;
                                123                 :                : 
                                124         [ +  + ]:           5324 :             while ((line = tsearch_readline(&trst)) != NULL)
                                125                 :                :             {
                                126                 :                :                 /*----------
                                127                 :                :                  * The format of each line must be "src" or "src trg", where
                                128                 :                :                  * src and trg are sequences of one or more non-whitespace
                                129                 :                :                  * characters, separated by whitespace.  Whitespace at start
                                130                 :                :                  * or end of line is ignored.  If trg is omitted, an empty
                                131                 :                :                  * string is used as the replacement.  trg can be optionally
                                132                 :                :                  * quoted, in which case whitespaces are included in it.
                                133                 :                :                  *
                                134                 :                :                  * We use a simple state machine, with states
                                135                 :                :                  *  0   initial (before src)
                                136                 :                :                  *  1   in src
                                137                 :                :                  *  2   in whitespace after src
                                138                 :                :                  *  3   in trg (non-quoted)
                                139                 :                :                  *  4   in trg (quoted)
                                140                 :                :                  *  5   in whitespace after trg
                                141                 :                :                  *  -1  syntax error detected (two strings)
                                142                 :                :                  *  -2  syntax error detected (unfinished quoted string)
                                143                 :                :                  *----------
                                144                 :                :                  */
                                145                 :                :                 int         state;
                                146                 :                :                 char       *ptr;
 5052 tgl@sss.pgh.pa.us         147                 :           5322 :                 char       *src = NULL;
                                148                 :           5322 :                 char       *trg = NULL;
  717 michael@paquier.xyz       149                 :           5322 :                 char       *trgstore = NULL;
                                150                 :                :                 int         ptrlen;
 5052 tgl@sss.pgh.pa.us         151                 :           5322 :                 int         srclen = 0;
                                152                 :           5322 :                 int         trglen = 0;
  717 michael@paquier.xyz       153                 :           5322 :                 int         trgstorelen = 0;
                                154                 :           5322 :                 bool        trgquoted = false;
                                155                 :                : 
 5052 tgl@sss.pgh.pa.us         156                 :           5322 :                 state = 0;
                                157         [ +  + ]:          27356 :                 for (ptr = line; *ptr; ptr += ptrlen)
                                158                 :                :                 {
                                159                 :          22034 :                     ptrlen = pg_mblen(ptr);
                                160                 :                :                     /* ignore whitespace, but end src or trg */
  263 peter@eisentraut.org      161         [ +  + ]:          22034 :                     if (isspace((unsigned char) *ptr))
                                162                 :                :                     {
 5052 tgl@sss.pgh.pa.us         163         [ +  + ]:          10472 :                         if (state == 1)
                                164                 :           5322 :                             state = 2;
                                165         [ +  + ]:           5150 :                         else if (state == 3)
  717 michael@paquier.xyz       166                 :           5054 :                             state = 5;
                                167                 :                :                         /* whitespaces are OK in quoted area */
                                168         [ +  + ]:          10472 :                         if (state != 4)
                                169                 :          10432 :                             continue;
                                170                 :                :                     }
 5052 tgl@sss.pgh.pa.us         171   [ +  -  +  +  :          11602 :                     switch (state)
                                              +  - ]
                                172                 :                :                     {
                                173                 :           5322 :                         case 0:
                                174                 :                :                             /* start of src */
                                175                 :           5322 :                             src = ptr;
                                176                 :           5322 :                             srclen = ptrlen;
                                177                 :           5322 :                             state = 1;
                                178                 :           5322 :                             break;
 5052 tgl@sss.pgh.pa.us         179                 :UBC           0 :                         case 1:
                                180                 :                :                             /* continue src */
                                181                 :              0 :                             srclen += ptrlen;
                                182                 :              0 :                             break;
 5052 tgl@sss.pgh.pa.us         183                 :CBC        5110 :                         case 2:
                                184                 :                :                             /* start of trg */
  717 michael@paquier.xyz       185         [ +  + ]:           5110 :                             if (*ptr == '"')
                                186                 :                :                             {
                                187                 :             56 :                                 trgquoted = true;
                                188                 :             56 :                                 state = 4;
                                189                 :                :                             }
                                190                 :                :                             else
                                191                 :           5054 :                                 state = 3;
                                192                 :                : 
 5052 tgl@sss.pgh.pa.us         193                 :           5110 :                             trg = ptr;
                                194                 :           5110 :                             trglen = ptrlen;
                                195                 :           5110 :                             break;
                                196                 :            938 :                         case 3:
                                197                 :                :                             /* continue non-quoted trg */
  717 michael@paquier.xyz       198                 :            938 :                             trglen += ptrlen;
                                199                 :            938 :                             break;
                                200                 :            232 :                         case 4:
                                201                 :                :                             /* continue quoted trg */
 5052 tgl@sss.pgh.pa.us         202                 :            232 :                             trglen += ptrlen;
                                203                 :                : 
                                204                 :                :                             /*
                                205                 :                :                              * If this is a quote, consider it as the end of
                                206                 :                :                              * trg except if the follow-up character is itself
                                207                 :                :                              * a quote.
                                208                 :                :                              */
  717 michael@paquier.xyz       209         [ +  + ]:            232 :                             if (*ptr == '"')
                                210                 :                :                             {
                                211         [ +  + ]:             72 :                                 if (*(ptr + 1) == '"')
                                212                 :                :                                 {
                                213                 :             16 :                                     ptr++;
                                214                 :             16 :                                     trglen += 1;
                                215                 :                :                                 }
                                216                 :                :                                 else
                                217                 :             56 :                                     state = 5;
                                218                 :                :                             }
 5052 tgl@sss.pgh.pa.us         219                 :            232 :                             break;
 5052 tgl@sss.pgh.pa.us         220                 :UBC           0 :                         default:
                                221                 :                :                             /* bogus line format */
                                222                 :              0 :                             state = -1;
                                223                 :              0 :                             break;
                                224                 :                :                     }
                                225                 :                :                 }
                                226                 :                : 
 4086 tgl@sss.pgh.pa.us         227   [ +  -  +  + ]:CBC        5322 :                 if (state == 1 || state == 2)
                                228                 :                :                 {
                                229                 :                :                     /* trg was omitted, so use "" */
                                230                 :            212 :                     trg = "";
                                231                 :            212 :                     trglen = 0;
                                232                 :                :                 }
                                233                 :                : 
                                234                 :                :                 /* If still in a quoted area, fallback to an error */
  717 michael@paquier.xyz       235         [ -  + ]:           5322 :                 if (state == 4)
  717 michael@paquier.xyz       236                 :UBC           0 :                     state = -2;
                                237                 :                : 
                                238                 :                :                 /* If trg was quoted, remove its quotes and unescape it */
  717 michael@paquier.xyz       239   [ +  +  +  - ]:CBC        5322 :                 if (trgquoted && state > 0)
                                240                 :                :                 {
                                241                 :                :                     /* Ignore first and end quotes */
  712                           242                 :             56 :                     trgstore = (char *) palloc(sizeof(char) * (trglen - 2));
  717                           243                 :             56 :                     trgstorelen = 0;
                                244         [ +  + ]:            232 :                     for (int i = 1; i < trglen - 1; i++)
                                245                 :                :                     {
                                246                 :            176 :                         trgstore[trgstorelen] = trg[i];
                                247                 :            176 :                         trgstorelen++;
                                248                 :                :                         /* skip second double quotes */
                                249   [ +  +  +  - ]:            176 :                         if (trg[i] == '"' && trg[i + 1] == '"')
                                250                 :             16 :                             i++;
                                251                 :                :                     }
                                252                 :                :                 }
                                253                 :                :                 else
                                254                 :                :                 {
  712                           255                 :           5266 :                     trgstore = (char *) palloc(sizeof(char) * trglen);
  717                           256                 :           5266 :                     trgstorelen = trglen;
                                257                 :           5266 :                     memcpy(trgstore, trg, trgstorelen);
                                258                 :                :                 }
                                259                 :                : 
 4086 tgl@sss.pgh.pa.us         260         [ +  - ]:           5322 :                 if (state > 0)
 4504 heikki.linnakangas@i      261                 :           5322 :                     rootTrie = placeChar(rootTrie,
                                262                 :                :                                          (unsigned char *) src, srclen,
                                263                 :                :                                          trgstore, trgstorelen);
  717 michael@paquier.xyz       264         [ #  # ]:UBC           0 :                 else if (state == -1)
 4086 tgl@sss.pgh.pa.us         265         [ #  # ]:              0 :                     ereport(WARNING,
                                266                 :                :                             (errcode(ERRCODE_CONFIG_FILE_ERROR),
                                267                 :                :                              errmsg("invalid syntax: more than two strings in unaccent rule")));
  717 michael@paquier.xyz       268         [ #  # ]:              0 :                 else if (state == -2)
                                269         [ #  # ]:              0 :                     ereport(WARNING,
                                270                 :                :                             (errcode(ERRCODE_CONFIG_FILE_ERROR),
                                271                 :                :                              errmsg("invalid syntax: unfinished quoted string in unaccent rule")));
                                272                 :                : 
  717 michael@paquier.xyz       273                 :CBC        5322 :                 pfree(trgstore);
 5863 teodor@sigaev.ru          274                 :           5322 :                 pfree(line);
                                275                 :                :             }
 5052 tgl@sss.pgh.pa.us         276                 :              2 :             skip = false;
                                277                 :                :         }
 5863 teodor@sigaev.ru          278                 :UBC           0 :         PG_CATCH();
                                279                 :                :         {
                                280                 :                :             ErrorData  *errdata;
                                281                 :                :             MemoryContext ecxt;
                                282                 :                : 
                                283                 :              0 :             ecxt = MemoryContextSwitchTo(ccxt);
                                284                 :              0 :             errdata = CopyErrorData();
                                285         [ #  # ]:              0 :             if (errdata->sqlerrcode == ERRCODE_UNTRANSLATABLE_CHARACTER)
                                286                 :                :             {
                                287                 :              0 :                 FlushErrorState();
                                288                 :                :             }
                                289                 :                :             else
                                290                 :                :             {
                                291                 :              0 :                 MemoryContextSwitchTo(ecxt);
                                292                 :              0 :                 PG_RE_THROW();
                                293                 :                :             }
                                294                 :                :         }
 5863 teodor@sigaev.ru          295         [ -  + ]:CBC           2 :         PG_END_TRY();
                                296                 :                :     }
 5671 bruce@momjian.us          297         [ -  + ]:              2 :     while (skip);
                                298                 :                : 
 5863 teodor@sigaev.ru          299                 :              2 :     tsearch_readline_end(&trst);
                                300                 :                : 
 4504 heikki.linnakangas@i      301                 :              2 :     return rootTrie;
                                302                 :                : }
                                303                 :                : 
                                304                 :                : /*
                                305                 :                :  * findReplaceTo - find longest possible match in trie
                                306                 :                :  *
                                307                 :                :  * On success, returns pointer to ending subnode, plus length of matched
                                308                 :                :  * source string in *p_matchlen.  On failure, returns NULL.
                                309                 :                :  */
                                310                 :                : static TrieChar *
 4086 tgl@sss.pgh.pa.us         311                 :             79 : findReplaceTo(TrieChar *node, const unsigned char *src, int srclen,
                                312                 :                :               int *p_matchlen)
                                313                 :                : {
                                314                 :             79 :     TrieChar   *result = NULL;
                                315                 :             79 :     int         matchlen = 0;
                                316                 :                : 
                                317                 :             79 :     *p_matchlen = 0;            /* prevent uninitialized-variable warnings */
                                318                 :                : 
                                319   [ +  +  +  - ]:            226 :     while (node && matchlen < srclen)
                                320                 :                :     {
                                321                 :            147 :         node = node + src[matchlen];
                                322                 :            147 :         matchlen++;
                                323                 :                : 
                                324         [ +  + ]:            147 :         if (node->replaceTo)
                                325                 :                :         {
                                326                 :             37 :             result = node;
                                327                 :             37 :             *p_matchlen = matchlen;
                                328                 :                :         }
                                329                 :                : 
 5863 teodor@sigaev.ru          330                 :            147 :         node = node->nextChar;
                                331                 :                :     }
                                332                 :                : 
 4086 tgl@sss.pgh.pa.us         333                 :             79 :     return result;
                                334                 :                : }
                                335                 :                : 
 5863 teodor@sigaev.ru          336                 :              2 : PG_FUNCTION_INFO_V1(unaccent_init);
                                337                 :                : Datum
                                338                 :              2 : unaccent_init(PG_FUNCTION_ARGS)
                                339                 :                : {
 5671 bruce@momjian.us          340                 :              2 :     List       *dictoptions = (List *) PG_GETARG_POINTER(0);
 4504 heikki.linnakangas@i      341                 :              2 :     TrieChar   *rootTrie = NULL;
 5671 bruce@momjian.us          342                 :              2 :     bool        fileloaded = false;
                                343                 :                :     ListCell   *l;
                                344                 :                : 
 5863 teodor@sigaev.ru          345   [ +  -  +  +  :              4 :     foreach(l, dictoptions)
                                              +  + ]
                                346                 :                :     {
                                347                 :              2 :         DefElem    *defel = (DefElem *) lfirst(l);
                                348                 :                : 
 2780 tgl@sss.pgh.pa.us         349         [ +  - ]:              2 :         if (strcmp(defel->defname, "rules") == 0)
                                350                 :                :         {
 5863 teodor@sigaev.ru          351         [ -  + ]:              2 :             if (fileloaded)
 5863 teodor@sigaev.ru          352         [ #  # ]:UBC           0 :                 ereport(ERROR,
                                353                 :                :                         (errcode(ERRCODE_INVALID_PARAMETER_VALUE),
                                354                 :                :                          errmsg("multiple Rules parameters")));
 4504 heikki.linnakangas@i      355                 :CBC           2 :             rootTrie = initTrie(defGetString(defel));
 5671 bruce@momjian.us          356                 :              2 :             fileloaded = true;
                                357                 :                :         }
                                358                 :                :         else
                                359                 :                :         {
 5863 teodor@sigaev.ru          360         [ #  # ]:UBC           0 :             ereport(ERROR,
                                361                 :                :                     (errcode(ERRCODE_INVALID_PARAMETER_VALUE),
                                362                 :                :                      errmsg("unrecognized Unaccent parameter: \"%s\"",
                                363                 :                :                             defel->defname)));
                                364                 :                :         }
                                365                 :                :     }
                                366                 :                : 
 5863 teodor@sigaev.ru          367         [ -  + ]:CBC           2 :     if (!fileloaded)
                                368                 :                :     {
 5863 teodor@sigaev.ru          369         [ #  # ]:UBC           0 :         ereport(ERROR,
                                370                 :                :                 (errcode(ERRCODE_INVALID_PARAMETER_VALUE),
                                371                 :                :                  errmsg("missing Rules parameter")));
                                372                 :                :     }
                                373                 :                : 
 4504 heikki.linnakangas@i      374                 :CBC           2 :     PG_RETURN_POINTER(rootTrie);
                                375                 :                : }
                                376                 :                : 
 5863 teodor@sigaev.ru          377                 :              2 : PG_FUNCTION_INFO_V1(unaccent_lexize);
                                378                 :                : Datum
                                379                 :             28 : unaccent_lexize(PG_FUNCTION_ARGS)
                                380                 :                : {
 4504 heikki.linnakangas@i      381                 :             28 :     TrieChar   *rootTrie = (TrieChar *) PG_GETARG_POINTER(0);
 5671 bruce@momjian.us          382                 :             28 :     char       *srcchar = (char *) PG_GETARG_POINTER(1);
 5863 teodor@sigaev.ru          383                 :             28 :     int32       len = PG_GETARG_INT32(2);
 4085 tgl@sss.pgh.pa.us         384                 :             28 :     char       *srcstart = srcchar;
                                385                 :                :     TSLexeme   *res;
                                386                 :                :     StringInfoData buf;
                                387                 :                : 
                                388                 :                :     /* we allocate storage for the buffer only if needed */
                                389                 :             28 :     buf.data = NULL;
                                390                 :                : 
 4086                           391         [ +  + ]:            107 :     while (len > 0)
                                392                 :                :     {
                                393                 :                :         TrieChar   *node;
                                394                 :                :         int         matchlen;
                                395                 :                : 
                                396                 :             79 :         node = findReplaceTo(rootTrie, (unsigned char *) srcchar, len,
                                397                 :                :                              &matchlen);
 5671 bruce@momjian.us          398   [ +  +  +  - ]:             79 :         if (node && node->replaceTo)
                                399                 :                :         {
 4085 tgl@sss.pgh.pa.us         400         [ +  + ]:             37 :             if (buf.data == NULL)
                                401                 :                :             {
                                402                 :                :                 /* initialize buffer */
                                403                 :             25 :                 initStringInfo(&buf);
                                404                 :                :                 /* insert any data we already skipped over */
 5671 bruce@momjian.us          405         [ +  + ]:             25 :                 if (srcchar != srcstart)
 4085 tgl@sss.pgh.pa.us         406                 :              6 :                     appendBinaryStringInfo(&buf, srcstart, srcchar - srcstart);
                                407                 :                :             }
                                408                 :             37 :             appendBinaryStringInfo(&buf, node->replaceTo, node->replacelen);
                                409                 :                :         }
                                410                 :                :         else
                                411                 :                :         {
 4086                           412                 :             42 :             matchlen = pg_mblen(srcchar);
 4085                           413         [ +  + ]:             42 :             if (buf.data != NULL)
                                414                 :             18 :                 appendBinaryStringInfo(&buf, srcchar, matchlen);
                                415                 :                :         }
                                416                 :                : 
 4086                           417                 :             79 :         srcchar += matchlen;
                                418                 :             79 :         len -= matchlen;
                                419                 :                :     }
                                420                 :                : 
                                421                 :                :     /* return a result only if we made at least one substitution */
 4085                           422         [ +  + ]:             28 :     if (buf.data != NULL)
                                423                 :                :     {
                                424                 :             25 :         res = (TSLexeme *) palloc0(sizeof(TSLexeme) * 2);
                                425                 :             25 :         res->lexeme = buf.data;
                                426                 :             25 :         res->flags = TSL_FILTER;
                                427                 :                :     }
                                428                 :                :     else
                                429                 :              3 :         res = NULL;
                                430                 :                : 
 5863 teodor@sigaev.ru          431                 :             28 :     PG_RETURN_POINTER(res);
                                432                 :                : }
                                433                 :                : 
                                434                 :                : /*
                                435                 :                :  * Function-like wrapper for dictionary
                                436                 :                :  */
                                437                 :              4 : PG_FUNCTION_INFO_V1(unaccent_dict);
                                438                 :                : Datum
                                439                 :             19 : unaccent_dict(PG_FUNCTION_ARGS)
                                440                 :                : {
                                441                 :                :     text       *str;
                                442                 :                :     int         strArg;
                                443                 :                :     Oid         dictOid;
                                444                 :                :     TSDictionaryCacheEntry *dict;
                                445                 :                :     TSLexeme   *res;
                                446                 :                : 
                                447         [ +  + ]:             19 :     if (PG_NARGS() == 1)
                                448                 :                :     {
                                449                 :                :         /*
                                450                 :                :          * Use the "unaccent" dictionary that is in the same schema that this
                                451                 :                :          * function is in.
                                452                 :                :          */
 2557 tgl@sss.pgh.pa.us         453                 :             10 :         Oid         procnspid = get_func_namespace(fcinfo->flinfo->fn_oid);
                                454                 :             10 :         const char *dictname = "unaccent";
                                455                 :                : 
 2482 andres@anarazel.de        456                 :             10 :         dictOid = GetSysCacheOid2(TSDICTNAMENSP, Anum_pg_ts_dict_oid,
                                457                 :                :                                   PointerGetDatum(dictname),
                                458                 :                :                                   ObjectIdGetDatum(procnspid));
 2557 tgl@sss.pgh.pa.us         459         [ -  + ]:             10 :         if (!OidIsValid(dictOid))
 2557 tgl@sss.pgh.pa.us         460         [ #  # ]:UBC           0 :             ereport(ERROR,
                                461                 :                :                     (errcode(ERRCODE_UNDEFINED_OBJECT),
                                462                 :                :                      errmsg("text search dictionary \"%s.%s\" does not exist",
                                463                 :                :                             get_namespace_name(procnspid), dictname)));
 5863 teodor@sigaev.ru          464                 :CBC          10 :         strArg = 0;
                                465                 :                :     }
                                466                 :                :     else
                                467                 :                :     {
                                468                 :              9 :         dictOid = PG_GETARG_OID(0);
                                469                 :              9 :         strArg = 1;
                                470                 :                :     }
 3100 noah@leadboat.com         471                 :             19 :     str = PG_GETARG_TEXT_PP(strArg);
                                472                 :                : 
 5863 teodor@sigaev.ru          473                 :             19 :     dict = lookup_ts_dictionary_cache(dictOid);
                                474                 :                : 
                                475   [ -  +  -  -  :             19 :     res = (TSLexeme *) DatumGetPointer(FunctionCall4(&(dict->lexize),
                                     -  -  -  -  -  
                                           +  -  + ]
                                476                 :                :                                                      PointerGetDatum(dict->dictData),
                                477                 :                :                                                      PointerGetDatum(VARDATA_ANY(str)),
                                478                 :                :                                                      Int32GetDatum(VARSIZE_ANY_EXHDR(str)),
                                479                 :                :                                                      PointerGetDatum(NULL)));
                                480                 :                : 
                                481         [ -  + ]:             19 :     PG_FREE_IF_COPY(str, strArg);
                                482                 :                : 
 5671 bruce@momjian.us          483         [ +  + ]:             19 :     if (res == NULL)
                                484                 :                :     {
 5863 teodor@sigaev.ru          485                 :              2 :         PG_RETURN_TEXT_P(PG_GETARG_TEXT_P_COPY(strArg));
                                486                 :                :     }
 5671 bruce@momjian.us          487         [ -  + ]:             17 :     else if (res->lexeme == NULL)
                                488                 :                :     {
 5863 teodor@sigaev.ru          489                 :UBC           0 :         pfree(res);
                                490                 :              0 :         PG_RETURN_TEXT_P(PG_GETARG_TEXT_P_COPY(strArg));
                                491                 :                :     }
                                492                 :                :     else
                                493                 :                :     {
 5671 bruce@momjian.us          494                 :CBC          17 :         text       *txt = cstring_to_text(res->lexeme);
                                495                 :                : 
 5863 teodor@sigaev.ru          496                 :             17 :         pfree(res->lexeme);
                                497                 :             17 :         pfree(res);
                                498                 :                : 
                                499                 :             17 :         PG_RETURN_TEXT_P(txt);
                                500                 :                :     }
                                501                 :                : }
        

Generated by: LCOV version 2.4-beta