MN Public Salary Data - Multilevel Models

Load packages

library(tidyverse)
library(readxl)
library(skimr)

# Packages for manipulating name strings and guessing genders based on names
library(tm)
library(gender)
# Note: Need to install the 'genderdata' package from the ROpenSci repository -- not available on CRAN
# install.packages("genderdata", repos = "http://packages.ropensci.org") 
library(genderdata)

# Packages for timing 
library(beepr)
library(tictoc)

Read data

hr_2019 <- read_excel("./data/fiscal-year-2019.xlsx", sheet="FY19 HR INFO", na = "'', '-'")

Expecting numeric in J22556 / R22556C10: got '-'

# Convert these two columns to Date type files, instead of the strange character fields
# that Excel date columns sometimes get parsed as
hr_2019$ORIGINAL_HIRE_DATE <- as.Date(as.numeric(hr_2019$ORIGINAL_HIRE_DATE), origin = "1899-12-30")

NAs introduced by coercion

hr_2019$LAST_HIRE_DATE <- as.Date(as.numeric(hr_2019$LAST_HIRE_DATE), origin = "1899-12-30")

NAs introduced by coercion

# This column seems to import as POSIXct by default--not sure why it's different from the
# other two. The only thing we have to do is convert it to an R Date type.
hr_2019$JOB_ENTRY_DATE <- as.Date(hr_2019$JOB_ENTRY_DATE)

#earnings_2019 <- read_excel("./data/fiscal-year-2019.xlsx", sheet="FY19 EARNINGS")

Data transformations

Salaries are listed on either a biweekly or hourly basis: table(hr_2019$COMP_FREQUENCY_DESC). To be able to compare across salary types, we can standardize all salaries into an hourly rate. This will become our main response variable:

hr_2019 <- hr_2019 %>% 
  mutate(COMP_RATE_STND_HOURLY = ifelse(COMP_FREQUENCY_CODE == 'H', COMPENSATION_RATE, COMPENSATION_RATE / 80))

We can convert the date variables to a format that makes them slightly more interpretable. We’ll use the end of the calendar year (December 31, 2019) as a reference time frame:

hr_2019 <- hr_2019 %>%
  mutate(YRS_SINCE_ORIGINAL_HIRE = as.numeric((as.Date('2019-12-31') - ORIGINAL_HIRE_DATE)) / 365,
         YRS_SINCE_LAST_HIRE = as.numeric((as.Date('2019-12-31') - LAST_HIRE_DATE)) / 365,
         YRS_SINCE_JOB_ENTRY = as.numeric((as.Date('2019-12-31') - JOB_ENTRY_DATE)) / 365)

Clean up the postal codes so they’re all only 5 digits long:

hr_2019 <- hr_2019 %>%
  mutate(LOCATION_POSTAL_CODE_CLEANED = substr(LOCATION_POSTAL_CODE, 1, 5))

Clean duplicates

There is one TEMPORARY_ID value that appears to be shared across two different individuals. Let’s create a new UNIQUE_ID field that contains the TEMPORARY_ID plus the first letter of the person’s last name to create field that is truly distinct, in case we need to count or group by this field at some point:

hr_2019 %>% group_by(TEMPORARY_ID) %>% 
  summarise(distinct_names = length(unique(EMPLOYEE_NAME))) %>% 
  filter(distinct_names > 1)


hr_2019$UNIQUE_ID <- paste(hr_2019$TEMPORARY_ID, substring(hr_2019$EMPLOYEE_NAME, 1, 1), sep="")

Deal with bad/incomplete data

We have a lot of roles that have a COMPENSATION_RATE value of ‘0’. When we examine these more closely broken down by agency, we see that most of these are concentrated in ‘MN St Colleges & Universities’, where ~40% of roles have a compensation rate of ‘0’ listed!

hr_2019 %>% group_by(AGENCY_NAME) %>% 
  summarise(pct_of_roles_where_comp_rate_equals_zero =
              sum(ifelse(COMPENSATION_RATE == 0, 1, 0)) / n() ) %>%
  filter(pct_of_roles_where_comp_rate_equals_zero > 0) %>%
  arrange(desc(pct_of_roles_where_comp_rate_equals_zero))

This is profound enough that it seems likely to skew any conclusions we would make about this agency, so to keep thing simple for now, let’s filter this agency out of the rest of the analysis:

hr_2019 <- hr_2019 %>% filter(AGENCY_NAME != 'MN St Colleges & Universities')

The skim() function shows how many missing values we have within each column, along with some other helpful information. It looks like the LAST_HIRE_DATE is often missing, but we have pretty consistent data for pretty much everything else:

skim(hr_2019)

── Data Summary ────────────────────────
                           Values 
Name                       hr_2019
Number of rows             47759  
Number of columns          39     
_______________________           
Column type frequency:            
  character                25     
  Date                     3      
  numeric                  11     
________________________          
Group variables            None   

── Variable type: character ─────────────────────────────────────────────────────────────────────────────────
   skim_variable                n_missing complete_rate   min   max empty n_unique whitespace
 1 TEMPORARY_ID                         0             1    12    12     0    46721          0
 2 EMPLOYEE_NAME                        0             1     5    41     0    46614          0
 3 AGENCY_NBR                           0             1     3     3     0       91          0
 4 AGENCY_NAME                          0             1     6    30     0       91          0
 5 DEPARTMENT_NBR                       0             1     7     7     0     6879          0
 6 DEPARTMENT_NAME                      0             1     3    30     0     6038          0
 7 BRANCH_CODE                          0             1     1     1     0        4          0
 8 BRANCH_NAME                          0             1     5    11     0        4          0
 9 JOB_TITLE                            0             1     3    30     0     1642          0
10 LOCATION_NBR                         0             1     5     5     0     2029          0
11 LOCATION_NAME                        0             1     1    30     0     1713          0
12 LOCATION_POSTAL_CODE                 0             1     1     9     0      662          0
13 REG_TEMP_CODE                        0             1     1     1     0        8          0
14 REG_TEMP_DESC                        0             1     7    16     0        8          0
15 CLASSIFIED_CODE                      0             1     1     1     0        3          0
16 CLASSIFIED_DESC                      0             1    10    12     0        3          0
17 FULL_PART_TIME_CODE                  0             1     1     1     0        3          0
18 FULL_PART_TIME_DESC                  0             1     9    12     0        3          0
19 SALARY_PLAN_GRID                     0             1     1     4     0       89          0
20 COMP_FREQUENCY_CODE                  0             1     1     1     0        2          0
21 COMP_FREQUENCY_DESC                  0             1     6     8     0        2          0
22 BARGAINING_UNIT_NAME                 0             1     7    30     0       30          0
23 ACTIVE_ON_JUNE_30_2019               0             1     2     3     0        2          0
24 LOCATION_POSTAL_CODE_CLEANED         0             1     1     5     0      373          0
25 UNIQUE_ID                            0             1    13    13     0    46721          0

── Variable type: Date ──────────────────────────────────────────────────────────────────────────────────────
  skim_variable      n_missing complete_rate min        max        median     n_unique
1 ORIGINAL_HIRE_DATE        27         0.999 1949-06-13 2019-06-11 2010-10-12     7529
2 LAST_HIRE_DATE          7236         0.848 1978-08-08 2019-06-27 2014-08-11     4586
3 JOB_ENTRY_DATE             0         1     1965-02-03 2019-07-02 2016-06-15     5430

── Variable type: numeric ───────────────────────────────────────────────────────────────────────────────────
   skim_variable           n_missing complete_rate      mean       sd      p0     p25     p50     p75    p100
 1 RECORD_NBR                      0         1        0.0928    0.370   0        0       0       0       7   
 2 JOB_CODE                        0         1     3297.     2660.      1     1346.   2867    3677    9366   
 3 SALARY_GRADE_RANGE              0         1       27.6      25.3     1        8      16      57      96   
 4 MAX_SALARY_STEP                 0         1       10.7       4.02    1       10      12      13      19   
 5 COMPENSATION_RATE               0         1       79.9     522.      0       22.3    28.2    38.6  7706.  
 6 POSITION_FTE                    0         1        0.942     0.177   0        1       1       1       1.33
 7 BARGAINING_UNIT_NBR             0         1      217.       25.6   201      206     214     216     335   
 8 COMP_RATE_STND_HOURLY           0         1       31.2      12.3     0       22.3    28.2    38.6   171.  
 9 YRS_SINCE_ORIGINAL_HIRE        27         0.999   12.5      10.8     0.556    3.35    9.22   19.5    70.6 
10 YRS_SINCE_LAST_HIRE          7236         0.848    7.55      6.41    0.512    2.16    5.39   12.2    41.4 
11 YRS_SINCE_JOB_ENTRY             0         1        6.10      6.56    0.499    1.61    3.55    7.90   54.9 
   hist 
 1 ▇▁▁▁▁
 2 ▆▇▁▁▃
 3 ▇▁▁▃▁
 4 ▂▁▂▇▁
 5 ▇▁▁▁▁
 6 ▁▁▁▇▁
 7 ▇▁▁▁▁
 8 ▇▃▁▁▁
 9 ▇▃▁▁▁
10 ▇▃▂▁▁
11 ▇▂▁▁▁

Let’s filter the dataset to drop the LAST_HIRE_DATE columns, where we see a high number of NAs. Then, we can scan across the remaining columns and filter the dataset to include all rows where we have complete cases for the remaining columns. Note: Normally we would want to be a little more careful about filtering out incomplete cases before inspecting them more closely, but since our goal is to learn multilevel modeling without getting tripped up by errors due to missing data, we’ll consider this a “didactic shortcut”.

hr_2019 <- hr_2019 %>% select(-LAST_HIRE_DATE, -YRS_SINCE_LAST_HIRE)

hr_2019 <- hr_2019 %>% filter(complete.cases(.))

Here’s how we’ve narrowed down the dataset after cleaning:

74,304 (all roles, unfiltered) > 47,759 (after filtering out “MN St Colleges & Universities”) > 47,732 (after filtering out incomplete cases)

Guess gender

The public employees dataset doesn’t come with gender as a delivered field. Because we are interested in seeing if there are any gender-related trends around compensation, the best we will be able to do is guess the gender of each employee based on their first name. The gender and genderdata packages can help out with this. These packages leverage information from the Social Security Administration on which names were most frequently associated with which gender at different eras in history.

First, we need to extract the first name and last name into separate columns:

hr_2019 <- hr_2019 %>% 
  mutate(LAST_NAME = removePunctuation(str_extract(EMPLOYEE_NAME, "^(.+?),")),
         FIRST_NAME = removePunctuation(str_extract(EMPLOYEE_NAME, ",([A-Z|a-z]+)")))

Next, we define a get_gender() function that creates a mapping from each first name in the dataset to the most likely gender corresponding to that first name. This function takes a long time to run, so we’ll make sure to distinct() the set of names before passing them through to the function. We’ll also add some code that times how long it takes the function to run and emits a “beep” when it’s finished. (This is a convenient time to go take a coffee break!) When the results are ready, we’ll save them to a .csv file that we can use from session to session, so we don’t have to run this function more than once.

get_gender <- function(first_name) {
  results_df <- gender(as.character(first_name), method = "ssa", years = c(1950, 2012))
  gender_estimate <- as.character(results_df$gender)
  
  # If we didn't get a valid result, return 'unknown', otherwise return the result
  if(length(gender_estimate) == 0) {
    return("unknown")
  } else {
    return(results_df$gender)
  }
}

# Get all distinct first names and guess their genders (so we can join this back to the HR data after making the guesses)
# Runtime: ~22 min
tic("guessing names") 
gender_guesses <- hr_2019 %>%
  #filter(BARGAINING_UNIT_NAME == "Corrections Officers") %>% # test on a single bargaining unit to see if it's working
  select(FIRST_NAME) %>%
  distinct(FIRST_NAME) %>%
  mutate(GENDER = map_chr(FIRST_NAME, get_gender))
toc()

beepr::beep()

write.csv(gender_guesses, file="./data/gender_guesses.csv", row.names = FALSE)

Join the gender data back to the original dataset:

gender_guesses <- read.csv("./data/gender_guesses_backup.csv", header=TRUE)

hr_2019 <- left_join(hr_2019, gender_guesses, by=c("FIRST_NAME"))

Column `FIRST_NAME` joining character vector and factor, coercing into character vector

Additional notes on the gender guessing process…

Here are what the results from the gender package look like when it guesses the gender based on a name. You can see that it’s guessing the gender based on a simple “maximum likelihood” assessment of whether the name occurs more frequently in males vs. females based on the U.S. Social Security Administration’s baby name data. For now, we’ll use the guesses “as is”, but more sophisticated analyses may want to figure out ways to adjust for the level of uncertainty present in these guesses:

gender("River", method = "ssa", years = c(1950, 2012))

Just for fun…what are the most popular names?

hr_2019 %>% group_by(FIRST_NAME) %>% 
  summarise(count = length(unique(TEMPORARY_ID))) %>% 
  arrange(desc(count)) %>%
  top_n(10)

Selecting by count

Let’s inspect the names for which our gender package wasn’t able to make a gender guess. It looks like we’re getting more ‘unknown’ values for names that may be more frequently associated with individuals with an immigrant background, or whose families have chosen to give them names that are outside of the American mainstream. In fact, this ‘unknown’ appears like it could act as a pretty strong proxy for something other than gender. We need to proceed with caution! This is a source of bias, and we need to take it into account when performing gender-based analyses with this column moving forward.

gender_guesses %>% filter(GENDER == 'unknown') %>% select(FIRST_NAME) %>% top_n(10)

Selecting by FIRST_NAME

LS0tCnRpdGxlOiAiTU4gUHVibGljIFNhbGFyeSBEYXRhIC0gTXVsdGlsZXZlbCBNb2RlbHMiCnN1YnRpdGxlOiAiRGF0YSBQcmVwIgphdXRob3I6IEFsaXNvbiBMaW5rCm91dHB1dDogaHRtbF9ub3RlYm9vawotLS0KCgojIyBMb2FkIHBhY2thZ2VzCgpgYGB7ciBsb2FkX2xpYnJhcmllcywgbWVzc2FnZT1GQUxTRSwgd2FybmluZz1GQUxTRX0KbGlicmFyeSh0aWR5dmVyc2UpCmxpYnJhcnkocmVhZHhsKQpsaWJyYXJ5KHNraW1yKQoKIyBQYWNrYWdlcyBmb3IgbWFuaXB1bGF0aW5nIG5hbWUgc3RyaW5ncyBhbmQgZ3Vlc3NpbmcgZ2VuZGVycyBiYXNlZCBvbiBuYW1lcwpsaWJyYXJ5KHRtKQpsaWJyYXJ5KGdlbmRlcikKIyBOb3RlOiBOZWVkIHRvIGluc3RhbGwgdGhlICdnZW5kZXJkYXRhJyBwYWNrYWdlIGZyb20gdGhlIFJPcGVuU2NpIHJlcG9zaXRvcnkgLS0gbm90IGF2YWlsYWJsZSBvbiBDUkFOCiMgaW5zdGFsbC5wYWNrYWdlcygiZ2VuZGVyZGF0YSIsIHJlcG9zID0gImh0dHA6Ly9wYWNrYWdlcy5yb3BlbnNjaS5vcmciKSAKbGlicmFyeShnZW5kZXJkYXRhKQoKIyBQYWNrYWdlcyBmb3IgdGltaW5nIApsaWJyYXJ5KGJlZXByKQpsaWJyYXJ5KHRpY3RvYykKYGBgCgoKIyMgUmVhZCBkYXRhCgpgYGB7ciByZWFkX2RhdGF9CmhyXzIwMTkgPC0gcmVhZF9leGNlbCgiLi9kYXRhL2Zpc2NhbC15ZWFyLTIwMTkueGxzeCIsIHNoZWV0PSJGWTE5IEhSIElORk8iLCBuYSA9ICInJywgJy0nIikKCiMgQ29udmVydCB0aGVzZSB0d28gY29sdW1ucyB0byBEYXRlIHR5cGUgZmlsZXMsIGluc3RlYWQgb2YgdGhlIHN0cmFuZ2UgY2hhcmFjdGVyIGZpZWxkcwojIHRoYXQgRXhjZWwgZGF0ZSBjb2x1bW5zIHNvbWV0aW1lcyBnZXQgcGFyc2VkIGFzCmhyXzIwMTkkT1JJR0lOQUxfSElSRV9EQVRFIDwtIGFzLkRhdGUoYXMubnVtZXJpYyhocl8yMDE5JE9SSUdJTkFMX0hJUkVfREFURSksIG9yaWdpbiA9ICIxODk5LTEyLTMwIikKaHJfMjAxOSRMQVNUX0hJUkVfREFURSA8LSBhcy5EYXRlKGFzLm51bWVyaWMoaHJfMjAxOSRMQVNUX0hJUkVfREFURSksIG9yaWdpbiA9ICIxODk5LTEyLTMwIikKCiMgVGhpcyBjb2x1bW4gc2VlbXMgdG8gaW1wb3J0IGFzIFBPU0lYY3QgYnkgZGVmYXVsdC0tbm90IHN1cmUgd2h5IGl0J3MgZGlmZmVyZW50IGZyb20gdGhlCiMgb3RoZXIgdHdvLiBUaGUgb25seSB0aGluZyB3ZSBoYXZlIHRvIGRvIGlzIGNvbnZlcnQgaXQgdG8gYW4gUiBEYXRlIHR5cGUuCmhyXzIwMTkkSk9CX0VOVFJZX0RBVEUgPC0gYXMuRGF0ZShocl8yMDE5JEpPQl9FTlRSWV9EQVRFKQoKI2Vhcm5pbmdzXzIwMTkgPC0gcmVhZF9leGNlbCgiLi9kYXRhL2Zpc2NhbC15ZWFyLTIwMTkueGxzeCIsIHNoZWV0PSJGWTE5IEVBUk5JTkdTIikKYGBgCgoKIyMgRGF0YSB0cmFuc2Zvcm1hdGlvbnMKClNhbGFyaWVzIGFyZSBsaXN0ZWQgb24gZWl0aGVyIGEgYml3ZWVrbHkgb3IgaG91cmx5IGJhc2lzOiBgdGFibGUoaHJfMjAxOSRDT01QX0ZSRVFVRU5DWV9ERVNDKWAuICBUbyBiZSBhYmxlIHRvIGNvbXBhcmUgYWNyb3NzIHNhbGFyeSB0eXBlcywgd2UgY2FuIHN0YW5kYXJkaXplIGFsbCBzYWxhcmllcyBpbnRvIGFuIGhvdXJseSByYXRlLiAgVGhpcyB3aWxsIGJlY29tZSBvdXIgbWFpbiByZXNwb25zZSB2YXJpYWJsZToKCmBgYHtyIHRyYW5zZm9ybV9jb21wX3JhdGV9CmhyXzIwMTkgPC0gaHJfMjAxOSAlPiUgCiAgbXV0YXRlKENPTVBfUkFURV9TVE5EX0hPVVJMWSA9IGlmZWxzZShDT01QX0ZSRVFVRU5DWV9DT0RFID09ICdIJywgQ09NUEVOU0FUSU9OX1JBVEUsIENPTVBFTlNBVElPTl9SQVRFIC8gODApKQpgYGAKCldlIGNhbiBjb252ZXJ0IHRoZSBkYXRlIHZhcmlhYmxlcyB0byBhIGZvcm1hdCB0aGF0IG1ha2VzIHRoZW0gc2xpZ2h0bHkgbW9yZSBpbnRlcnByZXRhYmxlLiBXZSdsbCB1c2UgdGhlIGVuZCBvZiB0aGUgY2FsZW5kYXIgeWVhciAoRGVjZW1iZXIgMzEsIDIwMTkpIGFzIGEgcmVmZXJlbmNlIHRpbWUgZnJhbWU6CgpgYGB7ciB0cmFuc2Zvcm1feWVhcnNfdmFyc30KaHJfMjAxOSA8LSBocl8yMDE5ICU+JQogIG11dGF0ZShZUlNfU0lOQ0VfT1JJR0lOQUxfSElSRSA9IGFzLm51bWVyaWMoKGFzLkRhdGUoJzIwMTktMTItMzEnKSAtIE9SSUdJTkFMX0hJUkVfREFURSkpIC8gMzY1LAogICAgICAgICBZUlNfU0lOQ0VfTEFTVF9ISVJFID0gYXMubnVtZXJpYygoYXMuRGF0ZSgnMjAxOS0xMi0zMScpIC0gTEFTVF9ISVJFX0RBVEUpKSAvIDM2NSwKICAgICAgICAgWVJTX1NJTkNFX0pPQl9FTlRSWSA9IGFzLm51bWVyaWMoKGFzLkRhdGUoJzIwMTktMTItMzEnKSAtIEpPQl9FTlRSWV9EQVRFKSkgLyAzNjUpCmBgYAoKQ2xlYW4gdXAgdGhlIHBvc3RhbCBjb2RlcyBzbyB0aGV5J3JlIGFsbCBvbmx5IDUgZGlnaXRzIGxvbmc6CgpgYGB7ciB0cmFuc2Zvcm1femlwX2NvZGV9CmhyXzIwMTkgPC0gaHJfMjAxOSAlPiUKICBtdXRhdGUoTE9DQVRJT05fUE9TVEFMX0NPREVfQ0xFQU5FRCA9IHN1YnN0cihMT0NBVElPTl9QT1NUQUxfQ09ERSwgMSwgNSkpCmBgYAoKCiMjIENsZWFuIGR1cGxpY2F0ZXMKClRoZXJlIGlzIG9uZSBgVEVNUE9SQVJZX0lEYCB2YWx1ZSB0aGF0IGFwcGVhcnMgdG8gYmUgc2hhcmVkIGFjcm9zcyB0d28gZGlmZmVyZW50IGluZGl2aWR1YWxzLiBMZXQncyBjcmVhdGUgYSBuZXcgYFVOSVFVRV9JRGAgZmllbGQgdGhhdCBjb250YWlucyB0aGUgYFRFTVBPUkFSWV9JRGAgcGx1cyB0aGUgZmlyc3QgbGV0dGVyIG9mIHRoZSBwZXJzb24ncyBsYXN0IG5hbWUgdG8gY3JlYXRlIGZpZWxkIHRoYXQgaXMgdHJ1bHkgZGlzdGluY3QsIGluIGNhc2Ugd2UgbmVlZCB0byBjb3VudCBvciBncm91cCBieSB0aGlzIGZpZWxkIGF0IHNvbWUgcG9pbnQ6CgpgYGB7ciBjbGVhbl9kdXBlc30KaHJfMjAxOSAlPiUgZ3JvdXBfYnkoVEVNUE9SQVJZX0lEKSAlPiUgCiAgc3VtbWFyaXNlKGRpc3RpbmN0X25hbWVzID0gbGVuZ3RoKHVuaXF1ZShFTVBMT1lFRV9OQU1FKSkpICU+JSAKICBmaWx0ZXIoZGlzdGluY3RfbmFtZXMgPiAxKQoKaHJfMjAxOSRVTklRVUVfSUQgPC0gcGFzdGUoaHJfMjAxOSRURU1QT1JBUllfSUQsIHN1YnN0cmluZyhocl8yMDE5JEVNUExPWUVFX05BTUUsIDEsIDEpLCBzZXA9IiIpCmBgYAoKCiMjIERlYWwgd2l0aCBiYWQvaW5jb21wbGV0ZSBkYXRhCgpXZSBoYXZlIGEgbG90IG9mIHJvbGVzIHRoYXQgaGF2ZSBhIGBDT01QRU5TQVRJT05fUkFURWAgdmFsdWUgb2YgJzAnLiAgV2hlbiB3ZSBleGFtaW5lIHRoZXNlIG1vcmUgY2xvc2VseSBicm9rZW4gZG93biBieSBhZ2VuY3ksIHdlIHNlZSB0aGF0IG1vc3Qgb2YgdGhlc2UgYXJlIGNvbmNlbnRyYXRlZCBpbiAnTU4gU3QgQ29sbGVnZXMgJiBVbml2ZXJzaXRpZXMnLCB3aGVyZSB+NDAlIG9mIHJvbGVzIGhhdmUgYSBjb21wZW5zYXRpb24gcmF0ZSBvZiAnMCcgbGlzdGVkIQoKYGBge3J9CmhyXzIwMTkgJT4lIGdyb3VwX2J5KEFHRU5DWV9OQU1FKSAlPiUgCiAgc3VtbWFyaXNlKHBjdF9vZl9yb2xlc193aGVyZV9jb21wX3JhdGVfZXF1YWxzX3plcm8gPQogICAgICAgICAgICAgIHN1bShpZmVsc2UoQ09NUEVOU0FUSU9OX1JBVEUgPT0gMCwgMSwgMCkpIC8gbigpICkgJT4lCiAgZmlsdGVyKHBjdF9vZl9yb2xlc193aGVyZV9jb21wX3JhdGVfZXF1YWxzX3plcm8gPiAwKSAlPiUKICBhcnJhbmdlKGRlc2MocGN0X29mX3JvbGVzX3doZXJlX2NvbXBfcmF0ZV9lcXVhbHNfemVybykpCmBgYAoKVGhpcyBpcyBwcm9mb3VuZCBlbm91Z2ggdGhhdCBpdCBzZWVtcyBsaWtlbHkgdG8gc2tldyBhbnkgY29uY2x1c2lvbnMgd2Ugd291bGQgbWFrZSBhYm91dCB0aGlzIGFnZW5jeSwgc28gdG8ga2VlcCB0aGluZyBzaW1wbGUgZm9yIG5vdywgbGV0J3MgZmlsdGVyIHRoaXMgYWdlbmN5IG91dCBvZiB0aGUgcmVzdCBvZiB0aGUgYW5hbHlzaXM6CgpgYGB7ciBmaWx0ZXJfbW5zdGF0ZX0KaHJfMjAxOSA8LSBocl8yMDE5ICU+JSBmaWx0ZXIoQUdFTkNZX05BTUUgIT0gJ01OIFN0IENvbGxlZ2VzICYgVW5pdmVyc2l0aWVzJykKYGBgCgoKVGhlIGBza2ltKClgIGZ1bmN0aW9uIHNob3dzIGhvdyBtYW55IG1pc3NpbmcgdmFsdWVzIHdlIGhhdmUgd2l0aGluIGVhY2ggY29sdW1uLCBhbG9uZyB3aXRoIHNvbWUgb3RoZXIgaGVscGZ1bCBpbmZvcm1hdGlvbi4gIEl0IGxvb2tzIGxpa2UgdGhlIGBMQVNUX0hJUkVfREFURWAgaXMgb2Z0ZW4gbWlzc2luZywgYnV0IHdlIGhhdmUgcHJldHR5IGNvbnNpc3RlbnQgZGF0YSBmb3IgcHJldHR5IG11Y2ggZXZlcnl0aGluZyBlbHNlOgoKYGBge3Igc2tpbX0Kc2tpbShocl8yMDE5KQpgYGAKCkxldCdzIGZpbHRlciB0aGUgZGF0YXNldCB0byBkcm9wIHRoZSBgTEFTVF9ISVJFX0RBVEVgIGNvbHVtbnMsIHdoZXJlIHdlIHNlZSBhIGhpZ2ggbnVtYmVyIG9mIE5Bcy4gIFRoZW4sIHdlIGNhbiBzY2FuIGFjcm9zcyB0aGUgcmVtYWluaW5nIGNvbHVtbnMgYW5kIGZpbHRlciB0aGUgZGF0YXNldCB0byBpbmNsdWRlIGFsbCByb3dzIHdoZXJlIHdlIGhhdmUgY29tcGxldGUgY2FzZXMgZm9yIHRoZSByZW1haW5pbmcgY29sdW1ucy4gIE5vdGU6IE5vcm1hbGx5IHdlIHdvdWxkIHdhbnQgdG8gYmUgYSBsaXR0bGUgbW9yZSBjYXJlZnVsIGFib3V0IGZpbHRlcmluZyBvdXQgaW5jb21wbGV0ZSBjYXNlcyBiZWZvcmUgaW5zcGVjdGluZyB0aGVtIG1vcmUgY2xvc2VseSwgYnV0IHNpbmNlIG91ciBnb2FsIGlzIHRvIGxlYXJuIG11bHRpbGV2ZWwgbW9kZWxpbmcgd2l0aG91dCBnZXR0aW5nIHRyaXBwZWQgdXAgYnkgZXJyb3JzIGR1ZSB0byBtaXNzaW5nIGRhdGEsIHdlJ2xsIGNvbnNpZGVyIHRoaXMgYSAiZGlkYWN0aWMgc2hvcnRjdXQiLgoKYGBge3IgZmlsdGVyX2NvbXBsZXRlX2Nhc2VzfQpocl8yMDE5IDwtIGhyXzIwMTkgJT4lIHNlbGVjdCgtTEFTVF9ISVJFX0RBVEUsIC1ZUlNfU0lOQ0VfTEFTVF9ISVJFKQoKaHJfMjAxOSA8LSBocl8yMDE5ICU+JSBmaWx0ZXIoY29tcGxldGUuY2FzZXMoLikpCmBgYAoKSGVyZSdzIGhvdyB3ZSd2ZSBuYXJyb3dlZCBkb3duIHRoZSBkYXRhc2V0IGFmdGVyIGNsZWFuaW5nOgoKKio3NCwzMDQqKiAoYWxsIHJvbGVzLCB1bmZpbHRlcmVkKSA+IAoqKjQ3LDc1OSoqIChhZnRlciBmaWx0ZXJpbmcgb3V0ICJNTiBTdCBDb2xsZWdlcyAmIFVuaXZlcnNpdGllcyIpID4gCioqNDcsNzMyKiogKGFmdGVyIGZpbHRlcmluZyBvdXQgaW5jb21wbGV0ZSBjYXNlcykKCgojIyBHdWVzcyBnZW5kZXIKClRoZSBwdWJsaWMgZW1wbG95ZWVzIGRhdGFzZXQgZG9lc24ndCBjb21lIHdpdGggZ2VuZGVyIGFzIGEgZGVsaXZlcmVkIGZpZWxkLiAgQmVjYXVzZSB3ZSBhcmUgaW50ZXJlc3RlZCBpbiBzZWVpbmcgaWYgdGhlcmUgYXJlIGFueSBnZW5kZXItcmVsYXRlZCB0cmVuZHMgYXJvdW5kIGNvbXBlbnNhdGlvbiwgdGhlIGJlc3Qgd2Ugd2lsbCBiZSBhYmxlIHRvIGRvIGlzIGd1ZXNzIHRoZSBnZW5kZXIgb2YgZWFjaCBlbXBsb3llZSBiYXNlZCBvbiB0aGVpciBmaXJzdCBuYW1lLiAgVGhlIGBnZW5kZXJgIGFuZCBgZ2VuZGVyZGF0YWAgcGFja2FnZXMgY2FuIGhlbHAgb3V0IHdpdGggdGhpcy4gIFRoZXNlIHBhY2thZ2VzIGxldmVyYWdlIGluZm9ybWF0aW9uIGZyb20gdGhlIFNvY2lhbCBTZWN1cml0eSBBZG1pbmlzdHJhdGlvbiBvbiB3aGljaCBuYW1lcyB3ZXJlIG1vc3QgZnJlcXVlbnRseSBhc3NvY2lhdGVkIHdpdGggd2hpY2ggZ2VuZGVyIGF0IGRpZmZlcmVudCBlcmFzIGluIGhpc3RvcnkuICAKCkZpcnN0LCB3ZSBuZWVkIHRvIGV4dHJhY3QgdGhlIGZpcnN0IG5hbWUgYW5kIGxhc3QgbmFtZSBpbnRvIHNlcGFyYXRlIGNvbHVtbnM6CgpgYGB7ciB0cmFuc2Zvcm1fbmFtZXN9CmhyXzIwMTkgPC0gaHJfMjAxOSAlPiUgCiAgbXV0YXRlKExBU1RfTkFNRSA9IHJlbW92ZVB1bmN0dWF0aW9uKHN0cl9leHRyYWN0KEVNUExPWUVFX05BTUUsICJeKC4rPyksIikpLAogICAgICAgICBGSVJTVF9OQU1FID0gcmVtb3ZlUHVuY3R1YXRpb24oc3RyX2V4dHJhY3QoRU1QTE9ZRUVfTkFNRSwgIiwoW0EtWnxhLXpdKykiKSkpCmBgYAoKTmV4dCwgd2UgZGVmaW5lIGEgZ2V0X2dlbmRlcigpIGZ1bmN0aW9uIHRoYXQgY3JlYXRlcyBhIG1hcHBpbmcgZnJvbSBlYWNoIGZpcnN0IG5hbWUgaW4gdGhlIGRhdGFzZXQgdG8gdGhlIG1vc3QgbGlrZWx5IGdlbmRlciBjb3JyZXNwb25kaW5nIHRvIHRoYXQgZmlyc3QgbmFtZS4gIFRoaXMgZnVuY3Rpb24gdGFrZXMgYSBfbG9uZ18gdGltZSB0byBydW4sIHNvIHdlJ2xsIG1ha2Ugc3VyZSB0byBgZGlzdGluY3QoKWAgdGhlIHNldCBvZiBuYW1lcyBiZWZvcmUgcGFzc2luZyB0aGVtIHRocm91Z2ggdG8gdGhlIGZ1bmN0aW9uLiAgV2UnbGwgYWxzbyBhZGQgc29tZSBjb2RlIHRoYXQgdGltZXMgaG93IGxvbmcgaXQgdGFrZXMgdGhlIGZ1bmN0aW9uIHRvIHJ1biBhbmQgZW1pdHMgYSAiYmVlcCIgd2hlbiBpdCdzIGZpbmlzaGVkLiAgKFRoaXMgaXMgYSBjb252ZW5pZW50IHRpbWUgdG8gZ28gdGFrZSBhIGNvZmZlZSBicmVhayEpICBXaGVuIHRoZSByZXN1bHRzIGFyZSByZWFkeSwgd2UnbGwgc2F2ZSB0aGVtIHRvIGEgLmNzdiBmaWxlIHRoYXQgd2UgY2FuIHVzZSBmcm9tIHNlc3Npb24gdG8gc2Vzc2lvbiwgc28gd2UgZG9uJ3QgaGF2ZSB0byBydW4gdGhpcyBmdW5jdGlvbiBtb3JlIHRoYW4gb25jZS4KCmBgYHtyIGdldF9nZW5kZXIsIGV2YWwgPSBGQUxTRX0KZ2V0X2dlbmRlciA8LSBmdW5jdGlvbihmaXJzdF9uYW1lKSB7CiAgcmVzdWx0c19kZiA8LSBnZW5kZXIoYXMuY2hhcmFjdGVyKGZpcnN0X25hbWUpLCBtZXRob2QgPSAic3NhIiwgeWVhcnMgPSBjKDE5NTAsIDIwMTIpKQogIGdlbmRlcl9lc3RpbWF0ZSA8LSBhcy5jaGFyYWN0ZXIocmVzdWx0c19kZiRnZW5kZXIpCiAgCiAgIyBJZiB3ZSBkaWRuJ3QgZ2V0IGEgdmFsaWQgcmVzdWx0LCByZXR1cm4gJ3Vua25vd24nLCBvdGhlcndpc2UgcmV0dXJuIHRoZSByZXN1bHQKICBpZihsZW5ndGgoZ2VuZGVyX2VzdGltYXRlKSA9PSAwKSB7CiAgICByZXR1cm4oInVua25vd24iKQogIH0gZWxzZSB7CiAgICByZXR1cm4ocmVzdWx0c19kZiRnZW5kZXIpCiAgfQp9CgojIEdldCBhbGwgZGlzdGluY3QgZmlyc3QgbmFtZXMgYW5kIGd1ZXNzIHRoZWlyIGdlbmRlcnMgKHNvIHdlIGNhbiBqb2luIHRoaXMgYmFjayB0byB0aGUgSFIgZGF0YSBhZnRlciBtYWtpbmcgdGhlIGd1ZXNzZXMpCiMgUnVudGltZTogfjIyIG1pbgp0aWMoImd1ZXNzaW5nIG5hbWVzIikgCmdlbmRlcl9ndWVzc2VzIDwtIGhyXzIwMTkgJT4lCiAgI2ZpbHRlcihCQVJHQUlOSU5HX1VOSVRfTkFNRSA9PSAiQ29ycmVjdGlvbnMgT2ZmaWNlcnMiKSAlPiUgIyB0ZXN0IG9uIGEgc2luZ2xlIGJhcmdhaW5pbmcgdW5pdCB0byBzZWUgaWYgaXQncyB3b3JraW5nCiAgc2VsZWN0KEZJUlNUX05BTUUpICU+JQogIGRpc3RpbmN0KEZJUlNUX05BTUUpICU+JQogIG11dGF0ZShHRU5ERVIgPSBtYXBfY2hyKEZJUlNUX05BTUUsIGdldF9nZW5kZXIpKQp0b2MoKQoKYmVlcHI6OmJlZXAoKQoKd3JpdGUuY3N2KGdlbmRlcl9ndWVzc2VzLCBmaWxlPSIuL2RhdGEvZ2VuZGVyX2d1ZXNzZXMuY3N2Iiwgcm93Lm5hbWVzID0gRkFMU0UpCmBgYAoKCkpvaW4gdGhlIGdlbmRlciBkYXRhIGJhY2sgdG8gdGhlIG9yaWdpbmFsIGRhdGFzZXQ6IAoKYGBge3IgdHJhbnNmb3JtX2pvaW5fZ2VuZGVyfQpnZW5kZXJfZ3Vlc3NlcyA8LSByZWFkLmNzdigiLi9kYXRhL2dlbmRlcl9ndWVzc2VzX2JhY2t1cC5jc3YiLCBoZWFkZXI9VFJVRSkKCmhyXzIwMTkgPC0gbGVmdF9qb2luKGhyXzIwMTksIGdlbmRlcl9ndWVzc2VzLCBieT1jKCJGSVJTVF9OQU1FIikpCmBgYAoKCioqKgoKCiMjIEFkZGl0aW9uYWwgbm90ZXMgb24gdGhlIGdlbmRlciBndWVzc2luZyBwcm9jZXNzLi4uCgpIZXJlIGFyZSB3aGF0IHRoZSByZXN1bHRzIGZyb20gdGhlIGBnZW5kZXJgIHBhY2thZ2UgbG9vayBsaWtlIHdoZW4gaXQgZ3Vlc3NlcyB0aGUgZ2VuZGVyIGJhc2VkIG9uIGEgbmFtZS4gWW91IGNhbiBzZWUgdGhhdCBpdCdzIGd1ZXNzaW5nIHRoZSBnZW5kZXIgYmFzZWQgIG9uIGEgc2ltcGxlICJtYXhpbXVtIGxpa2VsaWhvb2QiIGFzc2Vzc21lbnQgb2Ygd2hldGhlciB0aGUgbmFtZSBvY2N1cnMgbW9yZSBmcmVxdWVudGx5IGluIG1hbGVzIHZzLiBmZW1hbGVzIGJhc2VkIG9uIHRoZSBVLlMuIFNvY2lhbCBTZWN1cml0eSBBZG1pbmlzdHJhdGlvbidzIGJhYnkgbmFtZSBkYXRhLiAgRm9yIG5vdywgd2UnbGwgdXNlIHRoZSBndWVzc2VzICJhcyBpcyIsIGJ1dCBtb3JlIHNvcGhpc3RpY2F0ZWQgYW5hbHlzZXMgbWF5IHdhbnQgdG8gZmlndXJlIG91dCB3YXlzIHRvIGFkanVzdCBmb3IgdGhlIGxldmVsIG9mIHVuY2VydGFpbnR5IHByZXNlbnQgaW4gdGhlc2UgZ3Vlc3NlczoKCmBgYHtyfQpnZW5kZXIoIlJpdmVyIiwgbWV0aG9kID0gInNzYSIsIHllYXJzID0gYygxOTUwLCAyMDEyKSkKYGBgCgpKdXN0IGZvciBmdW4uLi53aGF0IGFyZSB0aGUgbW9zdCBwb3B1bGFyIG5hbWVzPwoKYGBge3J9CmhyXzIwMTkgJT4lIGdyb3VwX2J5KEZJUlNUX05BTUUpICU+JSAKICBzdW1tYXJpc2UoY291bnQgPSBsZW5ndGgodW5pcXVlKFRFTVBPUkFSWV9JRCkpKSAlPiUgCiAgYXJyYW5nZShkZXNjKGNvdW50KSkgJT4lCiAgdG9wX24oMTApCmBgYAoKCkxldCdzIGluc3BlY3QgdGhlIG5hbWVzIGZvciB3aGljaCBvdXIgZ2VuZGVyIHBhY2thZ2Ugd2Fzbid0IGFibGUgdG8gbWFrZSBhIGdlbmRlciBndWVzcy4gIEl0IGxvb2tzIGxpa2Ugd2UncmUgZ2V0dGluZyBtb3JlICd1bmtub3duJyB2YWx1ZXMgZm9yIG5hbWVzIHRoYXQgbWF5IGJlIG1vcmUgZnJlcXVlbnRseSBhc3NvY2lhdGVkIHdpdGggaW5kaXZpZHVhbHMgd2l0aCBhbiBpbW1pZ3JhbnQgYmFja2dyb3VuZCwgb3Igd2hvc2UgZmFtaWxpZXMgaGF2ZSBjaG9zZW4gdG8gZ2l2ZSB0aGVtIG5hbWVzIHRoYXQgYXJlIG91dHNpZGUgb2YgdGhlIEFtZXJpY2FuIG1haW5zdHJlYW0uICBJbiBmYWN0LCB0aGlzICd1bmtub3duJyBhcHBlYXJzIGxpa2UgaXQgY291bGQgYWN0IGFzIGEgcHJldHR5IHN0cm9uZyBwcm94eSBmb3Igc29tZXRoaW5nIF9vdGhlcl8gdGhhbiBnZW5kZXIuICBXZSBuZWVkIHRvIHByb2NlZWQgd2l0aCBjYXV0aW9uISAgKipUaGlzIGlzIGEgc291cmNlIG9mIGJpYXMsIGFuZCB3ZSBuZWVkIHRvIHRha2UgaXQgaW50byBhY2NvdW50IHdoZW4gcGVyZm9ybWluZyBnZW5kZXItYmFzZWQgYW5hbHlzZXMgd2l0aCB0aGlzIGNvbHVtbiBtb3ZpbmcgZm9yd2FyZC4qKgoKYGBge3J9CmdlbmRlcl9ndWVzc2VzICU+JSBmaWx0ZXIoR0VOREVSID09ICd1bmtub3duJykgJT4lIHNlbGVjdChGSVJTVF9OQU1FKSAlPiUgdG9wX24oMTApCmBgYAo=