LCOV - differential code coverage report
Current view: top level - src/backend/utils/adt - pg_locale_builtin.c (source / functions) Coverage Total Hit UNC UBC GNC CBC DCB
Current: 806555e3000d0b0e0c536c1dc65548128d457d86 vs 1d325ad99cb2dec0e8b45ba36909ee0a497d2a57 Lines: 88.2 % 93 82 8 3 34 48 9
Current Date: 2025-12-17 08:58:58 +0900 Functions: 81.8 % 22 18 4 17 1
Baseline: lcov-20251217-005640-baseline Branches: 62.5 % 32 20 2 10 4 16
Baseline Date: 2025-12-16 12:57:12 -0800 Line coverage date bins:
Legend: Lines:     hit not hit
Branches: + taken - not taken # not executed
(1,7] days: 0.0 % 2 0 2
(30,360] days: 87.0 % 54 47 6 1 34 13
(360..) days: 94.6 % 37 35 2 35
Function coverage date bins:
(1,7] days: 0.0 % 1 0 1
(30,360] days: 81.2 % 16 13 3 12 1
(360..) days: 100.0 % 5 5 5
Branch coverage date bins:
(30,360] days: 64.3 % 14 9 2 3 4 5
(360..) days: 61.1 % 18 11 7 11

 Age         Owner                    Branch data    TLA  Line data    Source code
                                  1                 :                : /*-----------------------------------------------------------------------
                                  2                 :                :  *
                                  3                 :                :  * PostgreSQL locale utilities for builtin provider
                                  4                 :                :  *
                                  5                 :                :  * Portions Copyright (c) 2002-2025, PostgreSQL Global Development Group
                                  6                 :                :  *
                                  7                 :                :  * src/backend/utils/adt/pg_locale_builtin.c
                                  8                 :                :  *
                                  9                 :                :  *-----------------------------------------------------------------------
                                 10                 :                :  */
                                 11                 :                : 
                                 12                 :                : #include "postgres.h"
                                 13                 :                : 
                                 14                 :                : #include "catalog/pg_database.h"
                                 15                 :                : #include "catalog/pg_collation.h"
                                 16                 :                : #include "common/unicode_case.h"
                                 17                 :                : #include "common/unicode_category.h"
                                 18                 :                : #include "miscadmin.h"
                                 19                 :                : #include "utils/builtins.h"
                                 20                 :                : #include "utils/pg_locale.h"
                                 21                 :                : #include "utils/syscache.h"
                                 22                 :                : 
                                 23                 :                : extern pg_locale_t create_pg_locale_builtin(Oid collid,
                                 24                 :                :                                             MemoryContext context);
                                 25                 :                : extern char *get_collation_actual_version_builtin(const char *collcollate);
                                 26                 :                : 
                                 27                 :                : struct WordBoundaryState
                                 28                 :                : {
                                 29                 :                :     const char *str;
                                 30                 :                :     size_t      len;
                                 31                 :                :     size_t      offset;
                                 32                 :                :     bool        posix;
                                 33                 :                :     bool        init;
                                 34                 :                :     bool        prev_alnum;
                                 35                 :                : };
                                 36                 :                : 
                                 37                 :                : /*
                                 38                 :                :  * In UTF-8, pg_wchar is guaranteed to be the code point value.
                                 39                 :                :  */
                                 40                 :                : static inline char32_t
   49 jdavis@postgresql.or       41                 :GNC      112863 : to_char32(pg_wchar wc)
                                 42                 :                : {
                                 43         [ -  + ]:         112863 :     Assert(GetDatabaseEncoding() == PG_UTF8);
                                 44                 :         112863 :     return (char32_t) wc;
                                 45                 :                : }
                                 46                 :                : 
                                 47                 :                : static inline pg_wchar
                                 48                 :            528 : to_pg_wchar(char32_t c32)
                                 49                 :                : {
                                 50         [ -  + ]:            528 :     Assert(GetDatabaseEncoding() == PG_UTF8);
                                 51                 :            528 :     return (pg_wchar) c32;
                                 52                 :                : }
                                 53                 :                : 
                                 54                 :                : /*
                                 55                 :                :  * Simple word boundary iterator that draws boundaries each time the result of
                                 56                 :                :  * pg_u_isalnum() changes.
                                 57                 :                :  */
                                 58                 :                : static size_t
  366 jdavis@postgresql.or       59                 :CBC         412 : initcap_wbnext(void *state)
                                 60                 :                : {
                                 61                 :            412 :     struct WordBoundaryState *wbstate = (struct WordBoundaryState *) state;
                                 62                 :                : 
                                 63         [ +  + ]:            850 :     while (wbstate->offset < wbstate->len &&
                                 64         [ +  - ]:            753 :            wbstate->str[wbstate->offset] != '\0')
                                 65                 :                :     {
   49 jdavis@postgresql.or       66                 :GNC         753 :         char32_t    u = utf8_to_unicode((unsigned char *) wbstate->str +
  366 jdavis@postgresql.or       67                 :CBC         753 :                                         wbstate->offset);
  240                            68                 :            753 :         bool        curr_alnum = pg_u_isalnum(u, wbstate->posix);
                                 69                 :                : 
  366                            70   [ +  +  +  + ]:            753 :         if (!wbstate->init || curr_alnum != wbstate->prev_alnum)
                                 71                 :                :         {
                                 72                 :            315 :             size_t      prev_offset = wbstate->offset;
                                 73                 :                : 
                                 74                 :            315 :             wbstate->init = true;
                                 75                 :            315 :             wbstate->offset += unicode_utf8len(u);
                                 76                 :            315 :             wbstate->prev_alnum = curr_alnum;
                                 77                 :            315 :             return prev_offset;
                                 78                 :                :         }
                                 79                 :                : 
                                 80                 :            438 :         wbstate->offset += unicode_utf8len(u);
                                 81                 :                :     }
                                 82                 :                : 
                                 83                 :             97 :     return wbstate->len;
                                 84                 :                : }
                                 85                 :                : 
                                 86                 :                : static size_t
                                 87                 :           6013 : strlower_builtin(char *dest, size_t destsize, const char *src, ssize_t srclen,
                                 88                 :                :                  pg_locale_t locale)
                                 89                 :                : {
  334                            90                 :          12026 :     return unicode_strlower(dest, destsize, src, srclen,
   78 peter@eisentraut.org       91                 :GNC        6013 :                             locale->builtin.casemap_full);
                                 92                 :                : }
                                 93                 :                : 
                                 94                 :                : static size_t
  366 jdavis@postgresql.or       95                 :CBC          97 : strtitle_builtin(char *dest, size_t destsize, const char *src, ssize_t srclen,
                                 96                 :                :                  pg_locale_t locale)
                                 97                 :                : {
                                 98                 :             97 :     struct WordBoundaryState wbstate = {
                                 99                 :                :         .str = src,
                                100                 :                :         .len = srclen,
                                101                 :                :         .offset = 0,
   78 peter@eisentraut.org      102                 :GNC          97 :         .posix = !locale->builtin.casemap_full,
                                103                 :                :         .init = false,
                                104                 :                :         .prev_alnum = false,
                                105                 :                :     };
                                106                 :                : 
  334 jdavis@postgresql.or      107                 :CBC         194 :     return unicode_strtitle(dest, destsize, src, srclen,
   78 peter@eisentraut.org      108                 :GNC          97 :                             locale->builtin.casemap_full,
                                109                 :                :                             initcap_wbnext, &wbstate);
                                110                 :                : }
                                111                 :                : 
                                112                 :                : static size_t
  366 jdavis@postgresql.or      113                 :CBC      158459 : strupper_builtin(char *dest, size_t destsize, const char *src, ssize_t srclen,
                                114                 :                :                  pg_locale_t locale)
                                115                 :                : {
  334                           116                 :         316918 :     return unicode_strupper(dest, destsize, src, srclen,
   78 peter@eisentraut.org      117                 :GNC      158459 :                             locale->builtin.casemap_full);
                                118                 :                : }
                                119                 :                : 
                                120                 :                : static size_t
  327 jdavis@postgresql.or      121                 :CBC           6 : strfold_builtin(char *dest, size_t destsize, const char *src, ssize_t srclen,
                                122                 :                :                 pg_locale_t locale)
                                123                 :                : {
                                124                 :             12 :     return unicode_strfold(dest, destsize, src, srclen,
   78 peter@eisentraut.org      125                 :GNC           6 :                            locale->builtin.casemap_full);
                                126                 :                : }
                                127                 :                : 
                                128                 :                : static bool
  169 jdavis@postgresql.or      129                 :          39008 : wc_isdigit_builtin(pg_wchar wc, pg_locale_t locale)
                                130                 :                : {
   49                           131                 :          39008 :     return pg_u_isdigit(to_char32(wc), !locale->builtin.casemap_full);
                                132                 :                : }
                                133                 :                : 
                                134                 :                : static bool
  169                           135                 :          19827 : wc_isalpha_builtin(pg_wchar wc, pg_locale_t locale)
                                136                 :                : {
   49                           137                 :          19827 :     return pg_u_isalpha(to_char32(wc));
                                138                 :                : }
                                139                 :                : 
                                140                 :                : static bool
  169                           141                 :          20609 : wc_isalnum_builtin(pg_wchar wc, pg_locale_t locale)
                                142                 :                : {
   49                           143                 :          20609 :     return pg_u_isalnum(to_char32(wc), !locale->builtin.casemap_full);
                                144                 :                : }
                                145                 :                : 
                                146                 :                : static bool
  169                           147                 :          12288 : wc_isupper_builtin(pg_wchar wc, pg_locale_t locale)
                                148                 :                : {
   49                           149                 :          12288 :     return pg_u_isupper(to_char32(wc));
                                150                 :                : }
                                151                 :                : 
                                152                 :                : static bool
  169 jdavis@postgresql.or      153                 :UNC           0 : wc_islower_builtin(pg_wchar wc, pg_locale_t locale)
                                154                 :                : {
   49                           155                 :              0 :     return pg_u_islower(to_char32(wc));
                                156                 :                : }
                                157                 :                : 
                                158                 :                : static bool
  169                           159                 :              0 : wc_isgraph_builtin(pg_wchar wc, pg_locale_t locale)
                                160                 :                : {
   49                           161                 :              0 :     return pg_u_isgraph(to_char32(wc));
                                162                 :                : }
                                163                 :                : 
                                164                 :                : static bool
  169                           165                 :              0 : wc_isprint_builtin(pg_wchar wc, pg_locale_t locale)
                                166                 :                : {
   49                           167                 :              0 :     return pg_u_isprint(to_char32(wc));
                                168                 :                : }
                                169                 :                : 
                                170                 :                : static bool
  169 jdavis@postgresql.or      171                 :GNC       12288 : wc_ispunct_builtin(pg_wchar wc, pg_locale_t locale)
                                172                 :                : {
   49                           173                 :          12288 :     return pg_u_ispunct(to_char32(wc), !locale->builtin.casemap_full);
                                174                 :                : }
                                175                 :                : 
                                176                 :                : static bool
  169                           177                 :           8312 : wc_isspace_builtin(pg_wchar wc, pg_locale_t locale)
                                178                 :                : {
   49                           179                 :           8312 :     return pg_u_isspace(to_char32(wc));
                                180                 :                : }
                                181                 :                : 
                                182                 :                : static bool
   60                           183                 :              3 : wc_isxdigit_builtin(pg_wchar wc, pg_locale_t locale)
                                184                 :                : {
   49                           185                 :              3 :     return pg_u_isxdigit(to_char32(wc), !locale->builtin.casemap_full);
                                186                 :                : }
                                187                 :                : 
                                188                 :                : static bool
    7 jdavis@postgresql.or      189                 :UNC           0 : wc_iscased_builtin(pg_wchar wc, pg_locale_t locale)
                                190                 :                : {
                                191                 :              0 :     return pg_u_prop_cased(to_char32(wc));
                                192                 :                : }
                                193                 :                : 
                                194                 :                : static pg_wchar
  169 jdavis@postgresql.or      195                 :GNC         264 : wc_toupper_builtin(pg_wchar wc, pg_locale_t locale)
                                196                 :                : {
   49                           197                 :            264 :     return to_pg_wchar(unicode_uppercase_simple(to_char32(wc)));
                                198                 :                : }
                                199                 :                : 
                                200                 :                : static pg_wchar
  169                           201                 :            264 : wc_tolower_builtin(pg_wchar wc, pg_locale_t locale)
                                202                 :                : {
   49                           203                 :            264 :     return to_pg_wchar(unicode_lowercase_simple(to_char32(wc)));
                                204                 :                : }
                                205                 :                : 
                                206                 :                : static const struct ctype_methods ctype_methods_builtin = {
                                207                 :                :     .strlower = strlower_builtin,
                                208                 :                :     .strtitle = strtitle_builtin,
                                209                 :                :     .strupper = strupper_builtin,
                                210                 :                :     .strfold = strfold_builtin,
                                211                 :                :     /* uses plain ASCII semantics for historical reasons */
                                212                 :                :     .downcase_ident = NULL,
                                213                 :                :     .wc_isdigit = wc_isdigit_builtin,
                                214                 :                :     .wc_isalpha = wc_isalpha_builtin,
                                215                 :                :     .wc_isalnum = wc_isalnum_builtin,
                                216                 :                :     .wc_isupper = wc_isupper_builtin,
                                217                 :                :     .wc_islower = wc_islower_builtin,
                                218                 :                :     .wc_isgraph = wc_isgraph_builtin,
                                219                 :                :     .wc_isprint = wc_isprint_builtin,
                                220                 :                :     .wc_ispunct = wc_ispunct_builtin,
                                221                 :                :     .wc_isspace = wc_isspace_builtin,
                                222                 :                :     .wc_isxdigit = wc_isxdigit_builtin,
                                223                 :                :     .wc_iscased = wc_iscased_builtin,
                                224                 :                :     .wc_tolower = wc_tolower_builtin,
                                225                 :                :     .wc_toupper = wc_toupper_builtin,
                                226                 :                : };
                                227                 :                : 
                                228                 :                : pg_locale_t
  380 jdavis@postgresql.or      229                 :CBC         925 : create_pg_locale_builtin(Oid collid, MemoryContext context)
                                230                 :                : {
                                231                 :                :     const char *locstr;
                                232                 :                :     pg_locale_t result;
                                233                 :                : 
                                234         [ +  + ]:            925 :     if (collid == DEFAULT_COLLATION_OID)
                                235                 :                :     {
                                236                 :                :         HeapTuple   tp;
                                237                 :                :         Datum       datum;
                                238                 :                : 
                                239                 :            899 :         tp = SearchSysCache1(DATABASEOID, ObjectIdGetDatum(MyDatabaseId));
                                240         [ -  + ]:            899 :         if (!HeapTupleIsValid(tp))
  380 jdavis@postgresql.or      241         [ #  # ]:UBC           0 :             elog(ERROR, "cache lookup failed for database %u", MyDatabaseId);
  380 jdavis@postgresql.or      242                 :CBC         899 :         datum = SysCacheGetAttrNotNull(DATABASEOID, tp,
                                243                 :                :                                        Anum_pg_database_datlocale);
                                244                 :            899 :         locstr = TextDatumGetCString(datum);
                                245                 :            899 :         ReleaseSysCache(tp);
                                246                 :                :     }
                                247                 :                :     else
                                248                 :                :     {
                                249                 :                :         HeapTuple   tp;
                                250                 :                :         Datum       datum;
                                251                 :                : 
                                252                 :             26 :         tp = SearchSysCache1(COLLOID, ObjectIdGetDatum(collid));
                                253         [ -  + ]:             26 :         if (!HeapTupleIsValid(tp))
  380 jdavis@postgresql.or      254         [ #  # ]:UBC           0 :             elog(ERROR, "cache lookup failed for collation %u", collid);
  380 jdavis@postgresql.or      255                 :CBC          26 :         datum = SysCacheGetAttrNotNull(COLLOID, tp,
                                256                 :                :                                        Anum_pg_collation_colllocale);
                                257                 :             26 :         locstr = TextDatumGetCString(datum);
                                258                 :             26 :         ReleaseSysCache(tp);
                                259                 :                :     }
                                260                 :                : 
                                261                 :            925 :     builtin_validate_locale(GetDatabaseEncoding(), locstr);
                                262                 :                : 
                                263                 :            925 :     result = MemoryContextAllocZero(context, sizeof(struct pg_locale_struct));
                                264                 :                : 
   78 peter@eisentraut.org      265                 :GNC         925 :     result->builtin.locale = MemoryContextStrdup(context, locstr);
                                266                 :            925 :     result->builtin.casemap_full = (strcmp(locstr, "PG_UNICODE_FAST") == 0);
  380 jdavis@postgresql.or      267                 :CBC         925 :     result->deterministic = true;
                                268                 :            925 :     result->collate_is_c = true;
                                269                 :            925 :     result->ctype_is_c = (strcmp(locstr, "C") == 0);
  169 jdavis@postgresql.or      270         [ +  + ]:GNC         925 :     if (!result->ctype_is_c)
                                271                 :            909 :         result->ctype = &ctype_methods_builtin;
                                272                 :                : 
  380 jdavis@postgresql.or      273                 :CBC         925 :     return result;
                                274                 :                : }
                                275                 :                : 
                                276                 :                : char *
  343                           277                 :            958 : get_collation_actual_version_builtin(const char *collcollate)
                                278                 :                : {
                                279                 :                :     /*
                                280                 :                :      * The only two supported locales (C and C.UTF-8) are both based on memcmp
                                281                 :                :      * and are not expected to change, but track the version anyway.
                                282                 :                :      *
                                283                 :                :      * Note that the character semantics may change for some locales, but the
                                284                 :                :      * collation version only tracks changes to sort order.
                                285                 :                :      */
                                286         [ +  + ]:            958 :     if (strcmp(collcollate, "C") == 0)
                                287                 :             31 :         return "1";
                                288         [ +  + ]:            927 :     else if (strcmp(collcollate, "C.UTF-8") == 0)
                                289                 :            917 :         return "1";
  334                           290         [ +  - ]:             10 :     else if (strcmp(collcollate, "PG_UNICODE_FAST") == 0)
                                291                 :             10 :         return "1";
                                292                 :                :     else
  343 jdavis@postgresql.or      293         [ #  # ]:UBC           0 :         ereport(ERROR,
                                294                 :                :                 (errcode(ERRCODE_WRONG_OBJECT_TYPE),
                                295                 :                :                  errmsg("invalid locale name \"%s\" for builtin provider",
                                296                 :                :                         collcollate)));
                                297                 :                : 
                                298                 :                :     return NULL;                /* keep compiler quiet */
                                299                 :                : }
        

Generated by: LCOV version 2.4-beta